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PRÉFACE 


L'essor impétueux du calcul numérique et de ses méthodes a remis 
à l’ordre du jour l’enseignement des mathématiques appliquées. Les 
matières professées sont étroitement liées aux cours de mathémati- 
ques traditionnels. Toutefois, la méthodologie et le contenu même 
de ces derniers doivent subir des modifications importantes. 

Le présent ouvrage est un exposé d’algèbre et de géométrie ana- 
lytique conçu sur la base du cours professé par l’auteur pendant plu- 
sieurs années à la Faculté de Calcul numérique et de Cybernétique 
de l’Université Lomonossov de Moscou. 

Le cours s’adresse surtout à ceux pour qui le calcul numérique 
est appelé à devenir une discipline importante; il s'inspire donc dans 
une grande mesure des idées de cette branche des mathématiques. 
On y trouve, bien sûr, l’exposé systématique de tous les fondements 
de l’algèbre et de la géométrie qu’impose l'étude de ces disciplines 
connexes. Cet ouvrage met surtout l'accent sur les chapitres dont 
l'ignorance rend difficile, voire impossible, toute initiation aux 
méthodes numériques si abondantes de l'algèbre. 


V. Voïévodine 


PREMIÈRE PARTIE 
ESPACES VECTORIELS 


CHAPITRE 1 


ENSEMBLES, ÉLÉMENTS, OPÉRATIONS 


$ 1. Ensembles et éléments 


Dans n'importe quel domaine d'activité nous sommes constam- 
ment obligés d'envisager de différentes collections d'objets réunis 
par quelque propriété commune. 

Ainsi, en étudiant la construction d'un mécanisme nous pou- 
vons considérer la collection de ses pièces. Ici chaque pièce repré- 
sente un objet isolé, et la propriété qui réunit tous ces objets est le 
fait de leur appartenance à un mécanisme déterminé. 

En parlant de la collection de points d’un cercle sur un plan nous 
séparons de tous les objets que sont les points du plan ceux qui 
sont liés par la propriété d’être équidistants d’un certain point 
fixe. 

En mathématiques une collection d'objets réunis par une pro- 
priété commune s'appelle ensemble, et les objets eux-mêmes, éléments 
de cet ensemble. Il est impossible de donner à la notion d'ensemble 
une définition rigoureuse. On peut dire, certes (comme nous l'avons 
fait, d’ailleurs !), qu’un ensemble est une «collection», un « systè- 
me », une « classe », etc. Mais ce serait là plutôt une tentative d'uti- 
liser formellement les richesses lexiques d’une langue. 

Pour définir une notion quelconque, il faut d’abord indiquer 
quels sont ses liens avec des notions plus générales. Or, dans le cas 
de l’ensemble ceci est impossible : il n'existe pas en mathématiques 
de notion plus générale. Aussi, au lieu d'expliquer ce terme par une 
définition, nous sommes obligés de recourir à des exemples. 

L'un des moyens les plus simples pour décrire un ensemble con- 
siste à donner la liste complète des éléments qui le composent. Par 
exemple, l’ensemble des livres accessibles à un lecteur dans une 
bibliothèque est totalement défini par les catalogues, l’ensemble des 
prix des marchandises, par des barêmes correspondants, etc. Pour- 
tant, cette méthode n'est applicable qu'à des ensembles finis, c'est- 
àa-dire à ceux dont le nombre d'éléments est fini. Quant aux ensem- 
bles infinis (au nombre infini d'éléments), leur définition à l'aide 
d'un tel recensement est impossible. Comment faire, par exemple, 
pour dresser la liste de tous les nombres réels ? 
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Lorsqu'il est impossible ou incommode de donner un ensemble à 
l’aide d’une liste, on indique sa propriété caractéristique, c'est-à- 
dire une propriété que possèdent les éléments de l’ensemble et seule- 
ment eux. Ainsi, pour les problèmes sur les lieux géométriques, la 
propriété caractéristique des points constituant la solution n'est 
rien d'autre que la collection de conditions imposées aux points par 
l’énoncé du problème. 

La description d'un ensemble peut être très simple et ne présen- 
ter aucune difficulté. Par exemple, si l’on parle de l'ensemble com- 
posé de deux nombres 1 et 2, il est clair que ni le nombre 3 ni un 
cahier scolaire, ni une voiture ne peuvent en faire partie. Mais dans 
le cas général, la définition des ensembles par des propriétés caracté- 
ristiques entraîne parfois des complications. Les causes en sont 
assez nombreuses. 

L'une de ces causes est due à la description de l’ensemble par des 
notions insuffisamment définies. Considérons, par exemple, l’en- 
semble des planètes du Système solaire. De quoi s'agit-il? On connaît 
neuf grandes planètes. Mais il y a encore plus de mille petites pla- 
nètes ou astéroïdes qui gravitent autour du Soleil. Les diamètres 
de certaines d’entre elles mesurent des centaines de kilomètres, mais 
il en existe d’autres dont le diamètre ne dépasse pas un kilomètre. 
Avec le perfectionnement des méthodes d'observation on découvrira 
des planètes de plus en plus petites; on se demandera, enfin, à un 
certain moment, où les petites planètes feront place aux météorites 
et à la poussière interstellaire ? 

La difficulté de déterminer la composition d’un ensemble n’a 
pas toujours à l’origine les causes de cette espèce. Il arrive que des 
‘ensembles à première vue bien définis, le sont très mal ou ne le sont 
pas du tout. Soit, par exemple, un ensemble composé d’un seul nom- 
bre. Supposons que ce dernier soit « le nombre minimal impossible 
à définir par une phrase de moins de cent mots ». Convenons qu'on n'u- 
tilise que des mots d’un certain vocabulaire ainsi que leurs formes 
grammaticales, et que ce vocabulaire comporte entre autres les mots 
«un», « deux », etc. 

Remarquons que d’une part un tel nombre n'existe pas du fait 
qu’il est déterminé par la phrase en italique qui compte moins de 
cent mots, alors que d’après le sens de cette phrase, il ne peut être 
déterminé de cette façon. Mais d'autre part, le nombre des mots uti- 
lisés étant fini, il existe des nombres ne se prêtant pas à la définition 
par une phrase de moins de cent mots, et par conséquent, parmi ces 
nombres il y en a un qui est minimal. 

La branche des mathématiques appellée théorie des ensembles con- 
naît déjà de nombreux exemples d’ensembles dont la définition 
présente des contradictions. L'étude des conditions qui entraînent 
cet état de choses a conduit à des recherches profondes dans le do- 
maine de la logique, mais nous n’allons pas nous y attarder. Partout 
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dans ce qui suit nous n'’envisagerons que des ensembles bien défi- 
nis, affranchis de toute contradiction et dont la composition ne donne 
lieu à aucun doute. 


Les ensembles seront désignés en général par des majuscules 
A, B, ..., leurs éléments, par des minuscules a, b, . .. Nous écri- 
rons x € À si x est un élément de l’ensemble 4, et x & À dans le 
cas contraire. 


Nous emploierons parfois la notion de l’ensemble vide, c’est-à- 
dire de l’ensemble qui ne contient aucun élément. Son utilisation 
est commode lorsqu'on ne sait pas à l’avance si la collection considé- 
rée possède au moins un élément. 


Exercices 


1. Donner des cxemples d'ensembles finis et infinis. Quelles propriétés. 
sont caractéristiques pour ces ensembles? 

2. Donner des exemples d’ensembles dont la description contient des 
contradictions. 

3. L'ensemble des racines réelles du polynôme z4 + 4x3 - Tr + 4r +1 
serait-il vide? 

4. Donner des exemples d’ensembles dont les éléments sont des ensembles. 

. ». Donner des exemples d'ensembles dont les éléments sont ces ensembles 

mêmes. 


$ 2. Opération algébrique 


Parmi toutes sortes d’ensembles on peut dégager ceux dont les 
éléments se prêtent à certaines opérations. Soit, par exemple, l’en- 
semble des nombres réels. Pour chaque élément de cet ensemble 
sont définies les opérations telles que le calcul de son module, de 
son sinus, et pour tout couple d'éléments, l'addition et la multi- 
plication. 

Dans cet exemple attirons surtout l'attention sur les particula- 
rités suivantes des opérations mentionnées. Premièrement, c’est que 
toutes les opérations sont définies quels que soient les éléments de 
l'ensemble donné; deuxièmement, toutes les opérations sont uni- 
voques, et, enfin, le résultat de chaque opération appartient à ce 
même ensemble. Il n’en est pas toujours ainsi, loin de là. 

Il se peut que l'opération ne soit pas définie pour tous les élé- 
ments de l’ensemble ; par exemple, le calcul du logarithme ne l’est 
pas pour des nombres négatifs. L’extraction de la racine carrée des 
nombres positifs est définie mais elle n'est pas univoque. Pourtant, 
même lorsque la définition d’une opération est univoque pour tous 
les éléments, le résultat de cette opération n'est pas de rigueur l’élé- 
ment de l’ensemble donné. Considérons l'opération de division sur 
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l’ensemble des entiers positifs. Il est clair que pour deux nombres 
quelconques de cet ensemble la division est réalisable mais le ré- 
sultat ne sera pas nécessairement un entier. 

Soit À un ensemble contenant au moins un élément. Nous dirons 
qu'une opération algébrique est définie sur l’ensemble À si l’on con- 
naît la loi d’après laquelle à tout couple d'éléments a et b pris dans 
cet ensemble dans l’ordre indiqué on associe d'une façon univoque 
un élément c appartenant également à cet ensemble. 

Cette opération peut être une addition; c sera alors la somme des 
éléments a et b notée c — a + b; mais elle peut être aussi bien une 
multiplication, et alors c sera le produit des éléments a et b noté 
c — ab. 

Pour une opération définie sur l’ensemble À, la terminologie et 
les notations ne joueront en général dans ce qui suit aucun rôle 
essentiel. Nous utiliserons les notations de la somme et du produit 
indépendamment du mode réel de définition de l'opération. Mais 
s'il nous faut insister sur quelques propriétés générales d’une opéra- 
tion algébrique, nous introduirons le symbole s». 

[lustrons par des exemples bien simples certaines propriétés 
d'une opération algébrique. Soit À l’ensemble de tous les nombres 
rationnels positifs. Introduisons pour les éléments de cet ensemble 
les opérations ordinaires de multiplication et de division des nom- 
bres et utilisons les notations usuelles. On vérifie sans peine queles 
deux opérations sur l’ensemble À sont algébriques. Mais si pour la 
multiplication, ab — ba pour tous les éléments de À, i.e. l’ordre des 
éléments est indifférent, dans le cas de la division cet ordre est de 
la première importance, puisque l'égalité a: b — b: a n’est possible 
que si a — b. Ainsi, bien qu'une opération algébrique soit définie 
pour un couple ordonné d'éléments, il arrive que l’ordre de ceux-ci 
soil sans effet. 

Une opération algébrique est dite commutative si son résultat ne 
dépend pas de l’ordre des éléments, i.e. si deux éléments a et b 
quelconques de l'ensemble donné vérifient l'égalité a+ b = bsa. 
Il est clair que parmi les opérations arithmétiques usuelles appli- 
quées aux nombres, l'addition et la multiplication sont des opéra- 
Lions commutatives, alors que la soustraction et la division ne le 
sont pas. 

Soient maintenant a, b, c trois éléments arbitraires. Une question 
se pose alors tout naturellement : quel sens faut-il attribuer à l’ex- 
pression a » b+c? Comment appliquer aux trois éléments une opé- 
ralion algébrique définie pour deux éléments? 

Puisqu'une opération algébrique ne peut être appliquée qu'à 
un couple d’éléments, pour donner à l'expression a » b « c une valeur 
définie on peut mettre entre parenthèses soit les deux premiers, 
soit les deux derniers éléments. Dans le premier cas l'expression se 
met. sous la forme (a « b)» c, et dans le deuxième, sous la forme 
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as (bs=c). Examinons les éléments d=asbete—b«.c; comme 
ils appartiennent à l’ensemble initial, (a+b)+cet a+(b+c) peu- 
vent être considérés comme résultant de l’opération algébrique appli- 
quée respectivement aux éléments d, cet a,e 

En général, les éléments d+c et ae peuvent être différents. 
Considérons encore l'ensemble des nombres rationnels positifs 
et l'opération algébrique de division des nombres dans cet en- 
semble. On voit aisément que dans les cas courants (a: b): c = 
£ a: ‘à c). Par exemple, ((3/2 : 3): (3/4) = 2/3, mais (3/2): (3: (3/4)) — 

— 3/8 

Une opération algébrique est dite associative si trois éléments 
quelconques a, b, c de l’ensemble initial satisfont à l'égalité 
as(bec) = (a=b}hsc. 

L'associativité d’une opération signifie que le résultat de son 
application aux trois éléments a, b, c, est défini d’une façon univo- 
que en entendant par ce résultat n'importe quelle des expressions 
égales a+ (b+c) et (a+ b)+c; elle permet d'écrire a + b»+c sans 
parenthèses. 

Dans le cas d’une opération associative on peut parler aussi de 
l'expression univoque &y*äz+ ...*# &, Contenant un nombre fini 
quelconque d'éléments &@;, a+, . .., a. La valeur de a; sa 

.. * 4, Se définit de la façon suivante. Mettons dans cette expres- 
sion des parenthèses arbitraires, pourvu qu’on puisse la définir en 
appliquant successivement l'opération algébrique aux couples 
d'éléments. Ainsi, pour cinq éléments a, 42, &3, &, &;, On peut répar- 
tir les parenthèses de la façon suivante: a; ((a: = Ga) + (a, » &:)), 
ou de la façon ((ay » @2) » ag) » (a, » a;), ou encore de nombreuses 
autres façons. 

Montrons que, pour une opération associative, le résultat du cal- 
cul ne dépend pas de la distribution des parenthèses. En effet, pour 
n — 3 cette assertion découle de la définition d’une opération asso- 
ciative. Ainsi, nous posons r > 3 et adoptons que notre proposition 
est déjà prouvée pour les nombres inférieurs à ». 

Soient les éléments a, &:, . . ., &, et une certaine distribution 
des parenthèses qui indique l’ordre des opérations à réaliser. Remar- 
quons que le dernier pas consistera toujours à réaliser l'opération 
sur deux éléments GisGge ...ûx et Auris Anpas . . . % An, 
pour un certain k qui satisfait à la condition 1 < k < nr — 1. Les 
deux expressions contenant moins de rx éléments, elles : sont par hy- 
pothèse définies d’une façon univoque, et il ne nous reste à prouver 


que tout couple k, / des entiers positifs, !{ > 1, donne lieu à l’éga- 
lité 


(aywass ...* ap)» (anis Quyrs .. #Qn) = 


= (as dus... + Qu) * (Apr # Upit42® oo # An). 
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L'opération étant associative, on introduit les notations 
Gyvüps ... an =D, 
Apt Th42® ee * Apt —C) 
Ahit+s * Ghsl4o * <. * On = À, 


et on obtient 
bs(c+d) = (bsc)+d, 


ce qui démontre notre proposition. 

Si l’opération associative est de plus commutative, l'expression 
Gy* as ... * a, ne dépend pas non plus de l’ordre des éléments. 
Nous laissons au lecteur le soin de le démontrer à titre d'exercice. 

Il ne faut pas penser que la commutativité et l’associativité 
d’une opération sont liées entre elles. On peut construire des opéra- 
tions comportant les combinaisons les plus différentes de ces proprié- 
tés. Nous avons déjà vu sur les exemples de multiplication et de di- 
vision qu'une opération peut être commutative et associative ou 
n'être ni l’une ni l’autre. Examinons encore deux exemples. Sup- 
posons qu’un ensemble soit composé de trois éléments a, b, c. Dé- 
finissons les opérations algébriques par les tableaux suivants: 


(2.1) 


et convenons qu'on choisit d’abord l'élément d’une colonne, puis 
l’élément d'une ligne, le résultat de l'opération étant fourni par 
l'intersection de la colonne et de la ligne. Dans le premier cas, évidem- 
ment, l'opération est commutative, mais non associative, puisque, 
par exemple, 
(as b)sc— c«c=c, 
amx(b+c)=a*a—= a. 


Dans le deuxième, n'étant pas commutative, elle est associative, 
ce qui est attesté sans peine par une vérification directe. 


Exercices 


4. Le calcul de tg z sur l’ensemble des nombres réels x serait-il une opéra- 
tion algébrique? 
2. Considerons l’ensemble des nombres réels r vérifiant l'inégalité | z| < 1. 
Dans cet ensemble, la multiplication, l'addition, la division et la soustraction 
des nombres seraient-elles des opérations algébriques? 


$ 3.] OPÉRATION INVERSE 43 


3. L'opération algébrique r+y — x? + y serait-elle commutative et asso- 
ciative sur l'ensemble des nombres réels x, y? 

4. Soit un ensemble composé d’un seul élément. Comment définir sur cet 
ensemble une opération algébrique? 

5. Construire des exemples des opérations algébriques sur un ensemble 
dont les éléments sont également des ensembles. Ces opérations sont-elles com- 
mutatives, associatives? 


$ 3. Opération inverse 


Soit À un ensemble dans lequel on donne une opération algébri- 
que. Nous savons déjà qu'elle associe à tout couple d'éléments a, b 
de À un troisième élément c — a = b. Considérons la collection C 
des éléments de À qui peuvent être représentés comme résultant de 
l'opération algébrique donnée. Il est clair que, quelle que soit l’opé- 
ration, tous les éléments de C sont à la fois les éléments de À. Ce- 
pendant il n'est pas du tout nécessaire que tous les éléments de À 
soient compris dans C. 

En effet, fixons dans l'ensemble À un certain élément f et faisons- 
le correspondre à tout couple d'éléments a, b de À. La correspon- 
dance ainsi établie est évidemment une opération algébrique, commu- 
tative et associative. L'ensemble C contiendra un seul élément f, 
indépendamment du nombre des éléments de l'ensemble À. 

C'est l'opération algébrique qui détermine exactement les élé- 
ments de À qui font partie de C. Supposons qu'elle soit telle que C 
se confond avec À, c'est-à-dire que les deux ensembles contiennent 
les mêmes éléments. Alors, chaque élément de À peut être repré- 
senté comme résultat de la réalisation de l’opération sur deux élé- 
ments quelconques du même ensemble À. Certes, une telle représen- 
tation peut ne pas être unique. Néanmoins nous en tirons la conclu- 
sion qu'à chaque élément de À on peut faire correspondre des couples 
d'éléments de À. 

Ainsi, l'opération algébrique initiale engendre sur l’ensemble À 
une autre opération. Cette dernière peut ne pas être univoque du 
fait qu’à un élément on peut faire correspondre plus d’un couple. 
Or, même si elle est univoque, elle n’est pas algébrique s'appliquant 
non pas à tout couple, mais à un seul élément bien que ce dernier 
puisse très bien être arbitraire. Il serait naturel d'appeler la nouvelle 
opération «inverse» par rapport à l'opération algébrique donnée. 
Quant à nous, nous allons entendre par opération inverse quelque 
chose de plus proche de la notion de l'opération algébrique. 

Remarquons que l’étude de l'opération « inverse » est équivalente 
à celle des éléments u, v qui vérifient l’égalité 


uUsv = b (3.1) 


pour des éléments b différents. La discussion de l'équation donnée 
par rapport à deux éléments u, v se réduit facilement à l'étude de 
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deux équations par rapport à un seul élément. A cette fin il suffit de 
fixer l’un de ces éléments et de trouver l'autre à partir de l'équation 
(3.1). Ainsi, l’étude de l'opération « inverse » est équivalente à la 
résolution des équations 


aGez—=b, ysa—=b (3.2) 


par rapport aux éléments x, y de À, en fixant les éléments diffé- 
rents a, b de À. 

Supposons que les équations (3.2) possèdent des solutions uniques 
quels que soient les éléments a, b de À. Alors, à tout couple ordonné 
a, b de À on peut associer les éléments x, y de À définis d’une façon 
univoque, c’est-à-dire introduire deux opérations algébriques. Ces 
opérations sont dites inverses à droite et à gauche respectivement par 
rapport à l’opération principale. Dans le cas où elles existent, nous 
dirons que l'opération principale possède une opération inverse. 
Notons que d’après l’exemple ci-dessus, il se peut très bien qu’une 
opération algébrique même commutative et associative ne possède 
pas d'opération inverse à droite ni à gauche. 

L'existence d’une opération inverse signifie qu'il existe deux 
opérations algébriques, en général différentes, les inverses à gauche 
et à droite. C’est pourquoi nous sommes obligés de parler de diffé- 
rents éléments zx, y. Mais si une opération algébrique est commutati- 
ve et s’il existe pour elle une opération inverse, il est alors évident 
que x = y et que l'opération inverse à droite se confond avec l’opéra- 
tion inverse à gauche. 

Examinons quelques exemples. Supposons que l’ensemble À 
soit l'axe réel et l'opération algébrique soit une multiplication 
ordinaire des nombres. Sur l’ensemble donné cette opération n’a 
pas d'opération inverse, puisque, par exemple, pour a = 0, b = 1, 
les égalités (3.2) ne peuvent avoir lieu quels que soient les nombres 
z et y. Mais si la multiplication est donnée seulement sur l’ensemble 
des nombres positifs, cette opération possède alors une opération 
inverse. 

En effet, quels que soient les nombres positifs a et b, il existe des 
nombres positifs, et des nombres positifs uniques, x et y qui véri- 
fient les egalités (3.2). Dans ce cas l'opération inverse n’est rien 
d’autre que la division des nombres. Le fait qu’en réalité zx = y n'a 
ici aucune importance. 

Si l’addition des nombres est donnée sur l’ensemble des nombres 
positifs, elle ne possède pas d'opération inverse puisque, pour a = 2, 
b — 1 par exemple, les égalités (3.2) ne peuvent être observées 
pour aucun couple de nombres positifs z, y. Mais si l’addition des 
nombres est donnée sur l’axe réel tout entier, l'opération inverse exis- 
te bien et ce n’est rien d’autre que la soustraction. 

L'exemple de la multiplication et de l'addition des nombres 
montre que les opérations directe et inverse peuvent posséder des 
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propriétés différentes. L'’associativité ou la commutativité d'une 
opération algébrique n'’entraînent pas nécessairement l’associativité 
ou la commutativité de l'opération inverse même si cette dernière 
existe. Bien plus, comme nous l’avons noté plus haut, une opéra- 
tion algébrique commutative et associative peut tout simplement ne 
pas posséder ni d'opération inverse à droite ni d’operation inverse à 
gauche. 

Ces exemples bien simples illustrent une autre circonstance im- 
portante. Considérons encore la multiplication sur l’ensemble des 
nombres positifs. Pour cette opération, les deux opérations inverses 
coïincident et constituent la division des nombres. À première vue il 
peut paraître maintenant que l'opération inverse de la division soit 
la multiplication des nombres. Or, il n’en est pas tout à fait ainsi. 

En effet, écrivons les équations correspondantes (3.2) 


az =0;, y: —= 0: 
Il est évident que 
z—=a:b, y — ab. 


Donc, pour la division des nombres l'opération inverse à droite 
est encore la division des nombres, alors que l’opération inverse à 
gauche est la multiplication. Ainsi l'opération inverse à l’opération 
inverse ne coïncide pas nécessairement avec l'opération algébrique 
initiale. 


Exercices 


1. Les opérations algébriques données par les tableaux (2.1) possèdent- 
elles des opérations inverses à droite et à gauche? 

2. Les Sp eees inverses à droite et à gauche que représentent-elles pour 
l'opération algébrique zey — rŸ définie sur l’ensemble des nombres positifs x, y? 

3. Montrer que si les opérations inverses à droite et à gauche coïncident, 
l'opération algébrique initiale est commutative. 

4. Prouver que si une opération algébrique possède l'opération inverse, 
les opérations inverses à droite et à gauche possèdent également leurs inverses. 
Ces dernières, que représentent-elles ? 


9. Construire un exemple d’opération algébrique telle que les quatre opéra- 
tions inverses de ses opérations inverses coïncident avec l'opération initiale. 


$ 4. Relation d'équivalence 


Remarquons que dans la discussion précédente des propriétés 
de l'opération algébrique nous avons supposé implicitement qu'il 
soit possible de vérifier si deux éléments quelconques d’un ensemble 
coïncident ou ne coïncident pas entre eux. Bien plus, nous avons 
traité les éléments qui se confondent avec une liberté assez grande en 
ne faisant aucune différence entre eux quels que soient les cas. Nous 
n'avons supposé nulle part que les éléments qui coïncident soient 
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en fait un seul élément et non pas des objets différents. Au fond, 
nous n'avons utilisé que le fait que dans certaines situations les 
éléments d'un certain groupe appelés éléments égaux se comportent 
de la même façon. 

C'est un état de choses qui se présente assez souvent. En étudiant 
les propriétés générales des triangles semblables nous ne faisons 
aucune différence entre tous les triangles de mêmes angles. Du point 
de vue des propriétés conservées par une homothétie, ces triangles 
sont indiscernables et pourraient s'appeler « égaux ». En étudiant 
les conditions d'égalité des triangles, nous ne faisons aucune diffé- 
rence entre les triangles situés dans des parties différentes d'un plan 
mais qu'on peut faire coïncider en les déplaçant. 

Dans les cas les plus différents nous aurons à partager tel ou tel 
ensemble en groupes d'éléments réunis possédant une certaine pro- 
priété. Si aucun élément n'appartient à deux groupes différents, 
nous dirons que l’ensemble est partagé en groupes disjoints ou 
classes. 

Bien que les propriétés d'après lesquelles les éléments se parta- 
gent en classes puissent être les plus différentes, elles ne sont pas 
pour autant tout à fait arbitraires. Supposons par exemple, qu’il 
s'agisse de classer tous les nombres réels en portant les nombres a 
et b dans la même classe si et seulement si b > a. Alors aucun a ne 
peut tomber dans la même classe que lui-même puisque a n’est pas 
plus grand que lui-même. Par conséquent, il est impossible de clas- 
ser d’après cette propriété. 

Soit une propriété. Admettons que pour tout couple d'éléments 
a et b de l’ensemble À on puisse dire que soit l'élément a est lié à 
l'élément b par la propriété donnée, soit il n’est pas lié par cette 
propriété. Si l'élément a est lié à b, nous écrirons a — b et nous 
dirons que a est équivalent à b. 

L'analyse des exemples les plus simples suggère déjà les condi- 
tions auxquelles doit satisfaire une propriété pour rendre possible 
la partition de l'ensemble À en classes d’après cette propriété. No- 
tamment, elle doit être: 

1) réflexive: «a — a pour tout a € À; 

2) symétrique: si a — b, alors ba; 

3) transitive: si a — b et b = c, alors a — c. 

La propriété qui vérifie ces conditions s'appelle relation d'équiva- 
lence. 

Montrons que toute relation d'équivalence permet de partager 
un ensemble en classes. En effet, soit À, le groupe d'éléments de À 
équivalents à un élément fixe a. En vertu de la réflexivité, a € 4. 
Prouvons que deux groupes, X, et K,, ou bien coïncident, ou bien 
ne possèdent pas d'éléments communs. 

Soit c un élément appartenant à X, et K,, c'est-à-dire c — a et 
c — b. En vertu de la symétrie, on a a — c, en vertu de la transiti- 
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vité, a — b et, certainement, b — a. Si maintenant z € X,, alors 
z = a, donc x — b, c'est-à-dire x € A4. D'une façon analogue, si 
zEK», on en déduit que x € À ,. Ainsi, deux groupes possédant au 
moins un élément commun se confondent complètement et, en fait, 
nous avons partagé l’ensemble À en classes. 

Du point de vue d’une propriété considérée, deux éléments quel- 
conques peuvent être ou ne pas être équivalents. Rien ne change 
si nous appelons égaux (par rapport à la propriété donnée !) les 
éléments équivalents et inégaux (par rapport à cette même pro- 
priété!) les éléments non équivalents. 

Il peut paraître que dans ces conditions nous négligeons le sens 
du mot «égaux », les éléments égaux par rapport à une propriété 
pouvant différer lorsqu'il s’agit d’une autre propriété. Pourtant il 
n’y a là rien qui ne soit pas naturel. Dans chaque problème concret 
que nous envisageons, les éléments se distinguent ou ne se distin- 
guent pas seulement par rapport aux propriétés qui nous intéressent 
précisément dans le problème concerné, alors que dans d’autres 
problèmes nous pouvons nous intéresser à des propriétés différentes 
des mêmes éléments. 

Dans ce qui suit nous considérerons que partout où cela est néces- 
saire, il faut définir une condition d'égalité qui permet de dire si 
un élément a est égal ou non à un élément b. Si l'élément a est égal 
à l'élément b, nous noterons a — b et dans le cas contraire, a = b. 
Supposons également que la condition d'égalité soit une relation 
d'équivalence. S'il en est ainsi, les conditions de réflexivité, de 
symétrie ou de transitivité sont considérées comme une généralisa- 
tion des propriétés correspondantes de la relation habituelle de 
l'égalité des nombres. 

L'introduction d’une relation d'égalité permet de partager un 
ensemble en classes des éléments que nous avons décidé pour telle 
ou telle raison de considérer comme égaux. Cela signifie que la 
différence entre les éléments appartenant à la même classe ne joue 
pour nous aucun rôle. Il s’ensuit que dans tous les cas que nous 
verrons dans ce qui suit les éléments dits égaux se comportent de la 
même façon. 

Dans le cas où, pour introduire une relation d'égalité, nous pro- 
céderons axiomatiquement, c'est-à-dire sans nous référer à la nature 
concrète des éléments, convenons que Île signe d'égalité exprime tout 
simplement que les éléments à gauche et à droite de ce signe coïnci- 
dent. Une telle utilisation du signe d'égalité assure automatiquement 
la réalisation des propriétés de réflexivité, de symétrie et de transi- 
tivité. Chaque classe des éléments égaux sera composée d’un seul 
élément. 

Lorsque nous introduirons une relation d'égalité en s'appuyant 
sur la nature concrète des éléments, il peut s'avérer que certaines ou 
toutes les classes des éléments égaux seront composées de plus d’un 
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élément. Il nous faut donc, en introduisant telles ou telles opérations 
sur les éléments, imposer aux opérations elles-mêmes une condition 
supplémentaire. 

En effet, nous avons convenu que les éléments égaux se compor- 
tent de la même façon. Donc, toute opération appliquée aux élé- 
ments égaux est censée de donner des résultats égaux. Pour notre 
part, nous ne nous attarderons pas à vérifier cette condition, et nous 
laissons au lecteur la justification de cette propriété pour toutes les 
opérations introduites. 


Exercices 


1. Peut-on classer tous les pays du globe en portant dans la même classe 
deux pays si et seulement si ils ont une frontière commune? Si c’est impossible, 
dire pourquoi en est-il ainsi? 

2. Considérons l’ensemble des villes liées par un trafic automobile. Disons 
que deux villes À et B sont liées si on peut aller de À à B par une route auto- 
mobile. Peut-on classer les villes d'après cette propriété? Si oui, les classes, que 


représentent-elles ? 
3. Disons que deux nombres complexes a et b sont égaux en module si 
|a| —|b]. Cette propriété serait-elle une relation d'équivalence? La divi- 


sion en classes, que représente-t-elle ? 
4. Considérons les opérations algébriques d’addition et de multiplication 
des nombres complexes. Comment agissent-elles dans les classes des éléments 


égaux en module? 
5. Donner des exemples d'opérations algébriques sur l’ensemble défini 


dans l'exercice 2. Comment agissent-elles dans les classes? 


$ 5. Segments orientés 


Les exemples étudiés précédemment donnent peut être l’impres- 
sion que toutes les discussions sur les opérations ne concernent que 
les ensembles numériques différents. Or, il n’en est rien. Par la 
suite nous verrons de nombreux exemples non numériques munis 
d'opérations; pour le moment examinons un seul exemple auquel 
nous nous référerons tout au cours de notre exposé. 

Les notions telles que force, déplacement, vitesse, accélération 
sont des concepts fondamentaux de la physique. Toutes ces notions 
sont caractérisées non seulement par un nombre qui détermine leur 
grandeur, mais encore par une certaine direction. Nous allons leur 
donner un analogue géométrique. 

Soient À et B deux points différents de l'espace. Sur la droite 
qui passe par ces points ils déterminent naturellement un segment. 
Convenons que les points sont toujours donnés dans un ordre déter- 
miné, par exemple, À étant le premier et B le second. A présent 
sur le segment construit nous choisissons comme sens de parcours 
celui du premier point À vers le deuxième point B. 

Un tel segment muni de sens de parcours s'appelle segment orienté 
d’origine À et d’extrémité B. Nous l’appelons encore vecteur en di- 
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sant que À est le point d'application de ce vecteur. Un vecteur ayant 
À pour point d'application sera appelé vecteur lié en À. 

Pour désigner les segments orientés ou vecteurs nous emploie- 
rons deux espèces de notation. S’il faut souligner qu'il s’agit d’un 


segment orienté d'origine À et d'extrémité B, nous noterons AB. 
Mais si les points frontières concrets du segment considéré ne sont 
pas importants, nous emploierons des notations plus simples, des 
minuscules latines, par exemple. Sur les figures, les segments orien- 
tés seront marqués par des flèches dont la pointe indiquera toujours 
l'extrémité du segment. 

Pour un segment orienté il importe lequel des points frontières est 
l'origine et lequel est l'extrémité. Nous adopterons donc que les 
segments orientés AB et BA sont différents. 

Ainsi, nous pouvons construire des ensembles différents dont les 
éléments sont des segments orientés. Avant d'introduire des opéra- 
tions sur ces éléments, décidons quels 
sont les éléments qu’il faut considé- Ê ul 
rer comme égaux. 

Examinons d’abord la translation 
d'un segment orienté AB au point C. 

Soit un point C qui n'appartient pas 

à la droite menée par À et B (fig. 5.1). 

Menons alors la droite qui passe par 

A et C, puis la droite qui passe par 4 C 

C parallèlement à AB et, enfin, celle 

qui passe par B parallèlement à AC. Fig. 5.1. 
Désignons par D le point d'inter- 

section des deux dernières droites. Considérons le segment orienté 
CD comme translation du segment AB en C. Mais si C repose sur la 
droite qui passe par À et B, le segment CD s’obtient par le glisse- 
ment du segment AB le long de la droite qui le contient jusqu'à ce 
que le point À se confond avec le point C. 

À présent nous pouvons définir l’égalité des vecteurs. Deux 
vecteurs sont dits égaux si on peut les faire coïncider par une transla- 
tion. On voit sans peine que cette définition est une relation d'équi- 
valence, c'est-à-dire qu’elle est réflexive, symétrique et transitive. 

Ainsi l’ensemble de tous les vecteurs est partagé naturellement 
en classes des vecteurs égaux. La description de chacune de ces clas- 
ses est bien simple, elle s'obtient en translatant l’un quelconque 
de $es vecteurs en tous les points de l’espace. 

Remarquons qu'à tout point de l’espace est lié un vecteur et un 
seu] de chaque classe des vecteurs égaux. Pour comparer deux vec- 
teurs a, b on peut donc procéder de la façon suivante. Fixons un cer- 
tain point et translatons-y les vecteurs a, b. Si les vecteurs ainsi 
obtenus se confondent, alors a — b, dans le cas contraire, a = b. 


9 + 


Cd 
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Outre l’ensemble de tous les vecteurs de l’espace, nous envisage- 
rons souvent d'autres ensembles. Ce seront surtout des ensembles des 
vecteurs parallèles à une certaine droite, ou bien reposant sur elle, 
ou des ensembles des vecteurs parallèles à un certain plan ou bien 
reposant dans ce plan. Nous dirons alors que ce sont respectivement 
des vecteurs colinéaires ou coplanaires. Bien sûr, nous conserverons 
sur les ensembles des vecteurs colinéaires et coplanaires la définition 
des vecteurs égaux donnée dans ce qui précède. 

Nous aurons également affaire aux segments orientés nuls dont 
l'origine et l'extrémité coïncident. Les vecteurs nuls n'ont pas de 
sens de parcours et, par définition ils sont tous considérés comme 
égaux. Si la donnée des points frontières d’un vecteur nul n’est pas 
de rigueur, nous le noterons (. 

Toujours par définition, nous admettrons que tout vecteur nul 
est parallèle à toute droite et à tout plan. C’est pourquoi dans tout 
ce qui suit, sauf indication contraire, nous supposerons que l'’en- 
semble des vecteurs de l’espace, ainsi que tout ensemble des vec- 
teurs colinéaires ou coplanaires comprenne également l’ensemble 
des vecteurs nuls. Il ne faut jamais l'oublier. 


Exercices 


1. Montrer que les vecteurs non nuls de l'espace peuvent être partagés 
en classes des vecteurs colinéaires non nuls. 

2. Montrer que toute classe des vecteurs colinéaires non nuls peut être parta- 
gée en classes des vecteurs non nuls égaux. 

3. Prouver que toute classe des vecteurs égaux non nuls fait partie d’une 
classe et d'une seule des vecteurs colinéaires non nuls. 

4. Peut-on partager les vecteurs non nuls de l’espace en classes des vecteurs 
coplanaires? Si cela est impossible, dire pourquoi? 

5. Prouver que tout ensemble des vecteurs coplanaires non nuls peut être 
partagé en classes des vecteurs colinéaires non nuls. 

6. Prouver que tout couple de classes différentes des vecteurs colinéaires 
- non nuls fait entièrement partie d'un ensemble et d’un seul des vecteurs copla- 
paires non nuls. 


$ 6. Addition des segments orientés 


Comme nous l’avons déjà dit, la force, le déplacement, la vitesse, 
l’accélération sont des prototypes des segments orientés que nous 
avons construits. Pour que ces segments puissent être employés en 
physique on doit tenir également compte des analogies physiques 
correspondantes lorsqu'on introduit les opérations sur ces segments. 

On connaît bien l'opération qui consiste à additionner les forces 
d'après la règle du parallélogramme. Cette même règle préside à 
l'addition des déplacements, des vitesses et des accélérations. Selon 
la terminologie adoptée, cette opération est algébrique, commutative 
et associative. Notre tâche immédiate consiste à construire une opé- 
ration analogue sur les segments orientés. 
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Donnons à l'addition des vecteurs la définition suivante. Soient a 
et b deux vecteurs à additionner. Réalisons la translation du vecteur 
b à l’extrémité du vecteur a (fig. 6.1). Appelons somme et désignons 
par a + b le vecteur dont l’origine coïncide avec celle de a, et l'’ex- 
trémité, avec l’extrémité de b. Cette règle s’appelle d'habitude « règle 
du triangle ». 

Il est clair que l'addition des vecteurs est une opération algébri- 
que. Montrons qu'elle est commutative et associative. 

Pour la commutativité, supposons d'abord que les vecteurs a et 
b ne soient pas colinéaires. Amenons-les à la même origine O 
(fig. 6.2). Désignons par À et B les 
extrémités respectives des vecteurs 
a et b et examinons le paral- : D 
lélogramme OBCA. La définition 
de l'égalité des vecteurs implique 


BC—0A=a, AC=0B=—b. Fig. 6.1. 


Mais alors, la même diagonale 8 a C 
OC du parallélogramme OBCA est 
à la fois a + b et b + a. Le cas 
de la colinéarité des vecteurs est b 
immédiat. 

Remarquons que nous avons 
obtenu accessoirement une autre 


SE 


méthode de construction delasom- © a A 
me des vecteurs. Notamment, si 
l'on construit un parallélogramme Fig. 6.2. 


sur les vecteurs a et b liés à un 
seul point, sa diagonale liée à ce même point donnera la som- 
me a + b. 

Pour démontrer l’associativité de l'addition, appliquons le vec- 
teur a à un point arbitraire O, le vecteur b, à l'extrémité du vecteur 
a et le vecteur c, à l'extrémité du vecteur b (fig. 6.3). Désignons par 
À, B, C les extrémités respectives des vecteurs a, b, c. Il vient 


(a+b)+c—(0A + AB) + BC—0OB+ BC—0OC, 
a+ (b+c) =0A + (AB + BC) = OA + AC =0OC. 


L'associativité des vecteurs résulte de la transitivité de leur 
relation d'égalité. 

Les propriétés démontrées de l'addition vectorielle permettent 
de calculer la somme d’un nombre quelconque de vecteurs. Si l’on 
applique un vecteur a; à l'extrémité d'un vecteur a,, un vecteur a, 
à l'extrémité du vecteur a, etc. et, enfin, un vecteur a, à l'extrémité 
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du vecteur a, _1, la somme a, + a> + ... + a, sera le vecteur dont 
l'origine coïncide avec l’origine de a, et l’extrémité, avec l'extré- 
mité de a,. On peut dire que cette règle de construction d’une somme 
de vecteurs consiste à compléter 
5 C çg une ligne polygonale par un segment 
qui la rend fermée. 
C Demandons-nous maintenant si 
V, b* ? °° » 
l’addition des vecteurs possède une 
= opération inverse? On sait que pour 
x répondre à cette question il faut 
œ É - rue one 
a étudier l'existence et l'unicité de 
la solution des équations 


a + x = b, y+a=b 


pour deux vecteurs arbitraires a 
et b. L'opération principale étant 
commutative, il est évident qu'il suffit d'étudier une des équations 
seulement. 


Soit AB un segment orienté arbitraire. Une construction géomé- 
trique élémentaire montre que les relations 


AB+BA=—0, AB+0—AB (6.1) 


ont toujours lieu. C’est pourquoi, quels que soient les vecteurs AB 
et CD, l'équation 


Fig. 6.3. 


AB+ TI = CD (6.2) 
possède bien au moins une solution, par exemple, 
z= BA + CD. (6.3) 


Supposons que l'équation (6.2) soit vérifiée également par un 
autre vecteur z, c’est-à-dire 


AB+z=CD, AB+z=CD. 


Alors, en ajoutant BA aux deux membres de ces égalités, on obtient, 
compte tenu de (6.1), que z = BA + CD, z = BA + CD, donc 
L'="Z: 

Ainsi l'addition que nous avons introduite possède une opération 
inverse. Cette opération s’appelle soustraction des vecteurs. Si les 
vecteurs a, b, c donnent lieu à l'égalité a + c — b, nous écrirons 
c — b — a. Le vecteur b — a défini de façon univoque par les vec- 
teurs b et a s’appelle différence de ces vecteurs. Ces notation et 
appellation seront justifiées plus loin. 

Il est facile d'indiquer une règle de construction de la différence 
de deux vecteurs donnés a, b. Appliquons ces vecteurs au même 
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point et construisons un parallélogramme ayant ces vecteurs pour 
côtés adjacents (fig. 6.4). Nous avons déjà montré que l’une des 
diagonales du parallélogramme est la somme des vecteurs donnés. 
On voit sans peine que l’autre diagonale en est la différence. Cette 
règle de construction de la somme et 


de la différence des vecteurs s'appelle 

généralement la « règle du parallélo- 

gramme ». a 
Remarquons que l’addition aurait L 

pu être définie non pas sur l’ensem- 

ble de tous les vecteurs de l’espace, 


mais seulement sur l’un des ensem- 

bles des vecteurs colinéaires ou co- Fig. 6.4. 
planaires. La somme de deux vecteurs 

des l’un quelconque de tels ensembles appartient encore au même 
ensemble. Il s’ensuit que là aussi l'addition des vecteurs est 
une opération algébrique. Bien plus, elle garde toutes ses pro- 
priétés et, ce qui importe surtout, possède toujours une opération 
inverse. Cette dernière proposition est justifiée par la formule (6.3). 


Si les vecteurs AB et CD sont parallèles à une certaine droite ou à 
un certain plan, il est évident que le vecteur BA + CD, ou ce qui 


revient au même, le vecteur de la différence CD — AB, le sera aussi. 

Ainsi, l’addition des vecteurs est une opération algébrique, com- 
mutative, associative et possède une opération inverse sur les ensem- 
bles de trois types: ensembles des vecteurs de l’espace, des vecteurs 
colinéaires et des vecteurs coplanaires. 


Exercices 


1. Trois forces égales en grandeur et dirigées suivant les arêtes sont appli- 
quées à l’un des sommets d’un cube. Quelle est la direction de la somme de 
ces forces? 

2. Soient trois classes différentes des vecteurs colinéaires. Dans quel cas 
de VOeiauE de l’espace peut être représenté par la somme des vecteurs de ces 
classes: 

3. Des forces égales en grandeur et dirigées vers le centre sont appliquées 
aux sommets d'un polygone régulier. Quelle est la somme de ces forces? 

4. Que représente l’ensemble des sommes des vecteurs pris dans deux clas- 
ses différentes des vecteurs colinéaires? 


$ 7. Groupes 


Les ensembles à une opération algébrique sont dans un certain 
sens les plus simples : il est donc naturel de commencer par eux notre 
discussion. Nous considérerons les propriétés d'opération comme des 
axiomes pour en déduire des corollaires. Ainsi, dans ce qui suit, nous 
pourrons appliquer les resultats obtenus à tous les ensembles sur 
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lesquels l'opération possède les mêmes propriétés, indépendamment 
des particularités concrètes. 

On appelle groupe un ensemble G muni d'une opération algébri- 
que associative (mais pas nécessairement commutative) et admettant 
l’opération inverse. 

Remarquons que l’opération inverse ne peut pas être considérée 
comme une deuxième opération indépendante dans le groupe, puis- 
qu'elle est définie à l’aide de l’opération principale. Comme c'est 
l'usage dans la théorie des groupes, appelons l'opération donnée 
dans G multiplication et convenons d’employer les notations corres- 
pondantes. Avant de considérer des exemples des groupes déduisons 
de la définition quelques conséquences. 

Soit a un élément du groupe G. L'existence de l'opération inver- 
se dans G entraîne l’existence d’un élément unique e, tel que ae, — 
— a. Par conséquent, lorsqu'il s’agit de multiplier à droite par cet 
élément, celui-ci tient le même rôle que l'unité pour la multiplica- 
tion des nombres. Soit b un autre élément du groupe. Il est évident 
qu'il existe un élément y tel que l'égalité ya = b soit vérifiée. On 
obtient à présent 


b — ya =7y (ae,) — (ya) Ex —= des. 


Aussi, l’élément e, joue le rôle de l’unité à droite non seulement 
pour a, mais pour tout élément du groupe G. Un élément qui possède 
cette propriété doit être unique. En effet, tout élément pareil véri- 
fie l'équation az = a; or, d’après la définition de l’opération inver- 
se, la solution de cette équation est unique. Désignons l'élément 
obtenu par e’. 

D'une manière analogue on peut démontrer l'existence et l’uni- 
cité d’un élément e” du groupe G tel que l’égalité e"b = b soit véri- 
fiée pour tout b de G. En réalité les éléments e” et e” coïncident par 
suite des égalités e”e” — e” et ee” = e°. 

Ainsi, nous avons obtenu le premier corollaire important : dans 
tout groupe G il existe un et seulement un élément e tel que l’on ait 
pour tout a de G 


ae = ea = dd. 


Cet élément est appelé unité du groupe G. 

Il résulte maintenant de la définition de l'opération inverse 
l’existence et l’unicité, pour tout élément a, d’un élément a” et d’un 
élément a” tels que 


Ces éléments s'appellent respectivement élément inverse à droite et 
élément inverse à gauche. On montre aisément que dans le cas con- 
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sidéré ils coïncident entre eux. En effet, examinons l'élément a”aa’ 
et calculons-le de deux façons différentes. On a 


a'aa = a” (aa')—=a"e = a”, 
a’aa’ = (a”a) a" —ea = a". 


Par conséquent, a” — a’. Cet élément noté a-! est dit inverse de l'é- 
lément a. 

Nous avons obtenu ainsi le deuxième corollaire important: dans 
tout groupe G tout élément a possède un élément inverse unique 
a”! tel que 


aa"i=a"la=e. (7.1) 


L'opération de groupe étant associative, on peut dire que le 
produit de tout nombre fini d'éléments du groupe pris dans un ordre 
déterminé (du fait de la non-commutativité éventuelle de l'opéra- 
tion de groupe) est défini d’une façon univoque. En tenant compte 
de la relation (7.1) il est facile d'obtenir la formule générale pour 
l'élément inverse du produit: 


(aus... an) = 407 4;,...0;. (7.2) 


La relation (7.1) entraîne que l'élément inverse à a”! est l’élé- 
ment a, et l'élément inverse à l’unité est encore l'unité, c'est-à-dire 


(a) f=a, ee: (7.3) 


Supposons qu'il s'agisse de vérifier si un ensemble muni d'une 
opération associative est un groupe. Cette vérification est rendue 
bien plus facile par le fait que dans la définition du groupe, l’exis- 
tence de l'opération inverse peut être remplacée par l'existence 
d’une unité et des éléments inverses à droite (ou bien à gauche), sans 
supposer leur unicité. Plus précisément, a lieu le théorème suivant : 

Théorème 7.1. Un ensemble G muni d'une opération asso- 
ciative est un groupe s’il existe dans G au moins un élément e vérifiant 
pour tout a de G l'égalité ae — a et tel que tout élément a de G possède 
par rapport à lui au moins un élément inverse à droite a”! c’est-à- 
dire aa”! = e. 

Démonstration. Soit a-! l’un des éléments inverses à 
droite de a. On a 


aa i—e—ee—=eaa !. 


Multiplions à droite les deux membres de cette égalité par l’un des 
éléments inverses à droite de a-!; il vient ae = eae, d'où l'égalité 
a — ea, e étant une unité à droite dans G. Aussi l’élément e est-il 
également une unité à gauche dans G. 

Soient maintenant e” et e” respectivement une unité à droite et 
une unité à gauche; alors les égalités e”e’ = e” et ee” = e” entrai- 
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nent e’ —e”; autrement dit, toute unité à droite est une unité à 
gauche. Ceci prouve l’existence et l’unicité de l’élément unité dans 
l’ensemble G; conformément à la notation introduite, nous désigne- 
rons cet élément par e. 

Ensuite on a pour tout élément inverse à droite a-!: 


a’i—=gte—a aa i. 


Multiplions à droite les deux membres de cette égalité par l'un 
des éléments inverses à droite de a-!. On obtient alors e — a”! a, 
c'est-à-dire que l'élément a-! est en même temps un élément inverse 
à gauche de a. Soient, maintenant, a-!” et a-!”, des éléments inver- 
ses de d respectivement à droite et à gauche; alors, les égalités 


a-l’aa-l’={(a-l'a)a-l'=ea-t"=a-i, 
a” l'aa-t’=a-t"(aa-t)=a lea ti 
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entraînent: a!” — a Cela traduit l'existence et l’unicité de 
l'élément inverse a-! pour tout élément a de G. 

À présent il est facile de montrer que l’ensemble G est un groupe. 
En effet, les équations ax = b et ya — b ont pour solutions res- 
pectives les éléments 


z=a@ "tb, y—ba". 


Supposons qu'il existe d’autres solutions, par exemple un élément z 
pour la première équation. Les égalités az = b et az = b entrai- 
pent alors ax = az. En multipliant les deux membres à gauche par 
l'élément a-!, on obtient x = z. Ainsi, l’ensemble G est un groupe. 

Un groupe est dit commutatif ou abélien si l'opération de groupe 
est commutative. Dans ce cas l'opération s'appelle généralement 
addition et la notation du produit ab est remplacée par celle de la 
somme a + b. L'élément unité du groupe abélien est noté O0 et 
appelé élément nul. L'opération inverse s'appelle soustraction, l'élé- 
ment inverse est dit opposé et noté —a. Nous convenons que, par 
définition, la notation de la différence a —b traduit la somme a + 
+ (—b). 

Mais si pour quelque raison l'opération d’un groupe commutatif 
s'appelle multiplication, l'opération inverse sera une division. Les 
produits a-!b et ba”, égaux dans ce cas, seront notés b/a et nommés 
quotient de b par a. 


Exercices. Montrer que les ensembles suivants sont des groupes abéliens. 
Partout l'appellation de l'opération porte non pas sur la notation mais sur 
le contenu. 

1. Ensemble: entiers: opération: addition des nombres. 

2. Ensemble: nombres complexes non nuls; opération: multiplication 
des nombres. 

3. Ensemble: entiers multiples de 3; opération: addition des nombres. 
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4. Ensemble: nombres rationnels positifs; opération: multiplication des 
nombres. 


5. Ensemble : nombres de la forme a + b V2, où a et b sont des nombres 
rationnels positifs; opération: multiplication des nombres. 

6. Ensemble: un élément a; l'opération s'appelle addition et se définit 
par l'égalité a + a = a. 

7. Ensemble: entiers 0, 1, 2, ..., n — 1; l'opération s'appelle « addition 
en module n » et consiste à calculer le reste non négatif inférieur à n de la divi- 
sion de la somme de deux nombres par le nombre n. 

8. Ensemble : entiers 1, 2, 3, ..., n — 1, où n est un nombre premier; 
l'opération s'appelle « multiplication en module ns» et consiste à calculer le 
reste non négatif inférieur à n de la division du produit de deux nombres 
par le nombre n. 

9. Ensemble : segments orientés colinéaires; opération: addition des seg- 
ments orientés. 

10. Ensemble: segments orientés coplanaires:; opération: addition des 
segments orientes. 

11. Ensemble: segments orientés de l’espace; opération: addition des 
segments orientés. 

Pour les trois derniers exemples, notons que l'élément nul du groupe abé- 
lien des segments orientés est le segment oriente nul, alors que le segment opposé 


de AB est BA. La démonstration donnée plus haut entraîne leur unicité. Des 
exemples de groupes non commutatifs seront donnés plus loin. 


$ 8. Anneaux et corps 


Considérons l’ensemble À muni de deux opérations. Appelons 
l'une d'elles addition et l’autre multiplication et utilisons les nota- 
tions correspondantes. Supposons que les deux opérations soient liées 
par la loi distributive, c'est-à-dire que, pour tout triplet d'éléments 
a, b, c de XX, les relations 


(a + b)c = ac + bc, a (b + c) = ab + ac 


soient vérifiées. 

L'ensemble Æ s’appelle anneau si sur cet ensemble sont défi- 
nies deux opératipns, appelées addition et multiplication, si ces 
opérations sont ciatives et liées par la loi distributive et si, de 
plus, l'addition est commutative et possède une opération inverse. 
L’anneau est dit commutatif si la multiplication est commutative, 
et non commutatif dans le cas contraire. 

Notons que tout anneau est un groupe abélien par rapport à 
l'addition. Par conséquent, il possède un élément nul unique 0. 
Cet élément est tel que tout élément a de l’anneau vérifie l'égalité 


a+0—=a. 


La définition de l'élément nul n’a été donnée que par rapport à 
l'addition. Or, cet élément joue également un rôle particulier par 
rapport à la multiplication. Plus précisément, dans tout anneau le 
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produit de tout élément par l'élément nul est un élément nul. En 
effet, soit a un élément de l'anneau Æ; alors 


a-0 = a (0 + 0) = a-0 + a-0. 


En ajoutant aux deux membres de cette égalité l'élément — a-0, 
on obtient a-0 — 0. D'une façon analogue on prouve que O-a — (0. 

En utilisant cette propriété de l'élément nul, on peut montrer 
que, dans un anneau tout couple d’éléments a, b vérifie l'égalité 


(—a) b = — (ab). 
En effet, 
ab + (—a) b = (a + (—a)) b = 0-b = 0, 


c'est-à-dire que l'élément (—a) b est l'opposé de l'élément ab. 
D'après les notations adoptées nous pouvons l'écrire sous la for- 
me —(ab). 

À présent il est facile de montrer que la loi distributive est égale- 
ment valable pour la différence des éléments. On a 


(a —b)c= (a+ (—b)) c = ac + (—b) c = ac + (— (bc)) — 
= ac — bc, 
a(b—c)=a(b + (—c)) = ab + a (—c) = ab + 
+ (— (ac)) = ab — ac. 


La loi distributive, c’est-à-dire la règle ordinaire de suppression 
des parenthèses est l'unique restriction dans la définition des an- 
neaux, imposée aux rapports entre l’addition et la multiplication. Ce 
n’est que grâce à cette loi que l'étude commune de ces deux opéra- 
tions est plus fructueuse que leur étude séparée. 

Nous venons de démontrer que les opérations algébriques sur un 
anneau jouissent de nombreuses propriétés propres aux opérations sur 
les nombres, et qui nous sont familières. Toutefois, il ne faut pas 
croire que toute propriété de l'addition ou de la multiplication des 
nombres se conserve dans tout anneau, même cohmutatif. Ainsi, la 
multiplication des nombres possède une propriété réciproque à celle 
de la multiplication par l’élément nul. Plus précisément, si le pro- 
duit de deux nombres est nul, alors au moins l’un des facteurs est 
nul. Or, cette propriété ne saurait être généralisée à tout anneau 
commutatif, c’est-à-dire le produit des éléments non nuls peut s’avé- 
rer nul. 

Les éléments non nuls dont le produit est un élément nul s’appel- 
lent diviseurs de zéro. Leur présence dans un anneau rend bien plus 
difficile l’étude et interdit une analogie profonde entre les nombres 
et les éléments d’un anneau commutatif. Une telle analogie est 
réalisable dans le cas des anneaux qui ne possèdent pas de diviseurs 
de zéro. 
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Supposons qu’un anneau commutatif possède par rapport à la 
multiplication l'élément unité e et que tout élément non nul a 
possède son inverse a”!. On montre sans peine que les éléments unité 
et inverse sont uniques; pourtant ce qui importe surtout, c'est qu’à 
présent l’anneau n’a pas de diviseurs de zéro. En effet, soit ab = 0, 
mais a 0. En multipliant à gauche les deux membres de cette 
égalité par l'élément a-!, on obtient 


a lab= (a 'a)b—eb=b 


et, bien sûr, a-10 — 0. Par conséquent, b = (. 

L'absence des diviseurs de zéro entraîne que toute égalité peut 
être réduite par un facteur commun non nul. Si ca =cbet cc 0, 
on a c(a — b) — 0, d’où a — b = 0, c'est-à-dire a = b. 

Un anneau commutatif P qui possède l’élément unité et dont 
tout élément non nul possède un élément inverse s'appelle corps. 

En utilisant la notation du quotient a/b sous la forme de produit 
ab”! on montre aisément que fout corps conserve toutes les règles 
usuelles de l'addition, de la soustraction, de La division et de la multi- 
plication des fractions. Notamment 

a c __ad + bc a c ac —@ a 
Ba À 6 da bar bp 
En outre, a/b = c/d si et seulement si ad — bc, à condition, bien 
sûr, que b Æ0et d-=0. Nous laissons au lecteur le soin de justifier 
ces assertions à titre d'exercice. 

Ainsi, du point de vue des règles usuelles relatives aux fractions, 
tous les corps ne se distinguent en rien de l’ensemble des nombres. 
Pour cette raison nous appellerons nombres les éléments de tout corps, 
si, bien entendu, cela ne prête pas à confusion. En général, l’élément 
nul d’un corps sera noté 0 et l'élément unité sera noté fi. 

Récapitulons maintenant les propriétés de base des éléments 
d’un corps dont nous aurons besoin dans ce qui suit. 

A. À tout couple d'éléments a, b correspond un élément a + b 
appelé somme de a et b; de plus: 

4) l’addition est commutative: a+ b=b+a; 

2) l’addition est associative: a + (b + c) = (a + b) + c; 

3) il existe l'élément nul unique O0 tel que a + 0 = a pour 
tout élément a; 

4) pour tout élément a il existe un seul élément opposé —a tel 
que a + (—a) —0. 

B. À tout couple d'éléments a, b correspond un élément ab 
appelé produit de a et b; de plus: 

4) la multiplication est commutative: ab = ba; 

2) la multiplication est associative: a (bc) = (ab) c; 

3) il existe un seul élément 1 tel que a-1 = 1-a = a pour tout 
élément a; 
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4) pour tout élément non nul a il existe un élément inverse uni- 
que a”! tel que aa”! — a-la — fi. 

C. L'addition et la multiplication sont liées par la propriété 
suivante: la multiplication est distributive par rapport à l’addi- 
tion, (a + b) c — ac + bc. 

Tous ces faits ne prétendent pas à l'indépendance logique et ne 
sont qu'une caractéristique commode des éléments. Les propriétés 
A décrivent un corps du point de vue de l'addition et montrent que 
le corps est un groupe abélien pour l’addition. Les propriétés B décri- 
vent un corps du point de vue de la multiplication, et montrent que 
pour qu'un corps devienne un groupe abélien pour la multiplication, 
il faut y éliminer l’élément nul. La propriété C décrit la liaison entre 
les deux opérations. 


Exercices. Prouver que les ensembles 1 à 7 sont des anneaux et non pas 
des corps, alors que les ensembles 8 à 13 sont des corps. Partout l’appellation 
de l'opération traduit le contenu et non la notation. 

1. Ensemble : entiers; opérations : addition et multiplication des nombres. 

2. Ensemble: entiers multiples d’un certain nombre nr; opérations: addi- 
tion et multiplication des nombres. 


3. Ensemble: nombres réels de la forme a + b V/2, où «a et b sont des 
entiers; opérations: addition et multiplication des nombres. 

4. Ensemble: polynômes à coefficients réels par rapport à une variable t#, 
y compris des constantes; opérations: addition et multiplication des polyno- 
mes. 

5. Ensemble: un élément a; les opérations sont définies par les égalités 
a+a—aet a-a = a. 

6. Ensemble : entiers 0, 1,2, ..., n — 4, où r est un nombre composé; 
opérations: addition et multiplication en module n. 

7. Ensemble: couples d’entiers (a, b); les opérations sont définies par 


les formules 
(a, b) + (c, d) = (a+c,b+ dj); 
(a, b)-(c, d) — (ac, bd). 


8. Ensemble : nombres rationnels; opérations: addition et multiplication 
des nombres. 

9. Ensemble: nombres réels; opérations: addition et multiplication des 
nombres. 

10. Ensemble: nombres complexes; opérations: addition et multiplica- 
tion des nombres. 


41. Ensemble: nombres réels de la forme a+ b V/2, où a et b sont des 
nombres rationnels; opérations: addition et multiplication des nombres. 
12. Ensemble: deux éléments a, b; les opérations sont données par les 
égalites 
a+a=b+b=a a+b=b+a—= b, 
a.a= a-b = b.-a = a, b-b = b. 


13. Ensemble : entiers 0, 1,2, ..., n — 1, où nr est un nombre premier: 
opérations: addition et multiplication en module n. 

Nous attirons l’attention du lecteur sur le fait que l’anneau donné dans un 
des exercices comporte des diviseurs de zéro. Quel est cet exercice? Quelle 
est la forme générale des diviseurs de zéro? 
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$ 9. Multiplication d’un segment orienté par un nombre 


Insistons encore une fois sur le fait que nous avons défini l'opé- 
ration algébrique comme une opération sur deux éléments apparte- 
nant au même ensemble. Mais la physique fournit de nombreux exem- 
ples où il est plus raisonnable d'étudier les opérations qui portent 
sur les éléments appartenant à des ensembles différents. L’une des 
opérations de ce type est suggérée par les notions de force, de dépla- 
cement, de vitesse et d'accélération, nous l'étudierons donc encore 
sur l’exemple des segments orientés. 

En physique on recourt aux segments depuis longtemps. Et si 
l'on dit, par exemple, qu’une force a augmenté cinq fois, on rempla- 
ce le segment qui la matérialise par un segment cinq fois plus long 
sans changer sa direction. Mais si on dit que la direction de la force 
change, alors on fait changer de place l’origine et l'extrémité du 
segment correspondant. En partant de ces considérations introdui- 
sons l’opération de multiplication du segment orienté par un nombre 
réel. 

Examinons d’abord certaines questions d'ordre général. Soit 
une ligne droite donnée dans un plan ou dans l’espace. Convenons 
de considérer comme positif l’un des deux sens de parcours de cette 
droite, et comme négatif, le sens opposé. Ceci fait, la droite sera 
appelée axe. 

Supposons maintenant donné un axe et, de plus, le segment uni- 
té avec lequel on puisse mesurer n'importe quel segment en défi- 
nissant ainsi sa longueur. À chaque segment orienté sur l’axe asso- 
cions une caractéristique numérique appelée mesure algébrique 
du segment orienté. 


On appelle mesure algébrique {AB} d'un segment orienté AB le 
nombre égal à la longueur du segment AB pris avec le signe « plus » 
si le sens de AB coïncide avec le sens positif de l’axe, et avec le si- 


gne « moins », si le sens de AB coïncide avec le sens négatif de l'axe. 
Les mesures algébriques de tous les segments orientés nuls sont 
nulles par définition: 


{AA}= 0. 
Indépendamment du choix du sens de parcours positif de l'axe, 


le sens de AB est opposé à celui de BA, alors que les longueurs des 
segments orientés AB et BA sont les mêmes, d'où 


{AB}= — {BA}. (9.1) 


Contrairement à la longueur, la mesure algébrique d’un segment 
orienté peut être positive ou négative. La longueur d'un segment 
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orienté AB étant le module de sa mesure algébrique est notée 
| AB |. Il est clair qu’à la différence de (9.1), on a 


[AB =] BA|. 


Soient sur un axe trois points quelconques À, B, C qui définis 


sent trois segments orientés AB, BC, AC. Quelle que soit la position 


des points, les mesures algébriques de ces segments satisfont à la 
relation 


{AB} +{BC}= {AC}. (9.2) 


En effet, supposons que le sens positif de l’axe et la disposition 
des points sont celles, par exemple, de la fig. 9.1. Il est alors évi- 
dent que 


[CAI+14B|=ICB|. (9.3) 
Selon la définition de la mesure algébrique et l’égalité (9.1), on a 
ICAI={C4}= —({4C), 1A4B|={4B), 
ICB|={CB}= — {BC}. 
Il résulte donc de (9.3) 
— {AC} + {4B}= — {BC} 


ce qui est équivalent à (9.2). 
Dans notre démonstration nous n'avons utilisé que les relations 
(9.3) et (9.4) qui dépendent seulement de la position relative des 
points À, B, C sur l'axe et ne dépendent pas 
—————— (le la coïncidence ou de la non-coincidence de 
C À ces points. Il est clair que la démonstration 
Fig. 9.1. est analoguejpour toute autre position rela- 
tive des points. 
L'identité (9.2) est appelée: identité principale. Du point de vue 
de l'addition des vecteurs portés par l’axe, elle signifie que 


(AB+ BC} =(AB)+ (BC). (9.5) 


La mesure algébrique d’un segment orienté définit ce segment à 
une translation près. Mais si l’on tient compte du fait que les seg- 
ments orientés égaux sont eux aussi définis à une translation près, 
cela signifie que sur l’axe donné la mesure algébrique d’un segment 
orienté définit d'une façon univoque toute la collection des segments 
orientés égaux. 


Soient AB un segment orienté et a un nombre. On appelle pro- 
duit a-AB du segment orienté AB par le nombre réel a le segment 


(9.4) 
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orienté porté par l’axe passant par les points À, B et dont la mesure 
algébrique est égale à a-{(4B)}. Ainsi, par définition, 


{a-AB}=a-{AB). (9.6) 


Pour n'importe quels nombres a, B et des segments orientés a, b 
quelconques, la multiplication d’un segment orienté par un nombre 
possède les propriétés suivantes: 


1:a = a, a (Ba) = (af) a, 
(a + B) a = aa + Ba, a (a + b) = aa + ab. 


Les trois premières propriétés sont bien simples. Pour les démontrer 
il suffit de remarquer que les vecteurs du premier et du second 
membres des égalités sont por- 


tés par le même axe, et utiliser 
les relations (9.5), (9.6). Prou- œa 
vons la quatrième propriété. 


Supposons pour simplifier que 
a > 0. Appliquons les vecteurs 
a, b à un même point et cons- & 
truisons sur ces vecteurs un 
parallélogramme dont la diago- 
pale sera a + b (fig. 9.2). Lors- 
qu'on multiplie les vecteurs a, b Fig. 9.2. 
par a, l’homothétie fait que la 
diagonale du parallélogramme se trouve également multipliée par 
a. Or, cela signifie précisément que aa + ab — a (a + b). 
Notons à titre de conclusion que la mesure algébrique d’un seg- 
ment orienté peut être envisagée comme une fonction 


ë = {x}, (9.7) 


qui a pour variable indépendante les vecteurs d’un même axe, et 
pour valeur les nombres réels E. De plus, 


{+ y}={z}+ {y}, | 
{Az} = 1 {x} 


pour tout couple de vecteurs x et y portés par l’axe et tout nombre a. 


(9.8) 


Exercices 
1. Montrer que le resultat de la multiplication par un nombre ne dépend 


pas du choix de sens positif de l’axe. 


2. Montrer que le résultat de la multiplication par un nombre ne dépend 
pas du choix du segment unité de l'axe. 


3—01090 
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3. Montrer que la multiplication par un nombre définie sur un ensemble 
des segments colinéaires est une opération interne, c'est-à-dire dont les valeurs 


appartiennent au même ensemble. 
4. Montrer que la multiplication par un nombre définie sur un ensemble 


des segments coplanaires est une opération interne. 
9. Un segment orienté nul et deux segments orientés opposés l’un à l’autre, 
que sont-ils du point de vue de la multiplication par un nombre? 


$ 10. Espaces vectoriels 


La résolution de n’importe quels problèmes se ramène finale- 
ment à l’étude de certains ensembles, et en premier lieu, à l'étude 
de leur structure. Les méthodes de cette étude sont les plus variées. 
Elles peuvent être basées sur la propriété caractéristique des élé- 
ments, comme c'est le cas des problèmes sur les lieux géométriques, 
ou sur les propriétés des opérations, si ces opérations sont définies 
pour les éléments. 

La généralité de cette dernière méthode la rend particulièrement 
avantageuse. En effet, nous avons déjà vu à plus d’une reprise que 
dans les ensembles les plus différents on peut introduire des opéra- 
tions les plus diverses, mais possédant les mêmes propriétés. Il est 
donc évident qu'un résultat fourni par la discussion des ensembles qui 
s'appuie seulement sur les propriétés d’une opération, aura lieu 
également dans tous les ensembles où les opérations possèdent les 
mêmes propriétés. Pour ce qui est de la nature des éléments, ainsi 
que des opérations qu’on leur applique, elle peut être la plus variée. 

Un peu plus haut nous avons introduit les objets mathématiques 
nouveaux appelés segments orientés ou vecteurs et défini certaines 
opérations sur ces objets. On sait que les vecteurs remplacent en fait 
des objets physiques bien réels. C'est pourquoi l'étude détaillée de 
la structure des ensembles vectoriels est d’un grand intérêt, au 
moins pour la physique. 

Nous connaissons déjà trois types d’ensembles pour lesquels les 
opérations ont les mêmes propriétés. Ce sont les ensembles des vec- 
teurs colinéaires, des vecteurs coplanaires et de tous les vecteurs de 
l’espace. Malgré les mêmes opérations introduites dans ces ensem- 
bles, la structure de ces derniers devrait être différente. 

La simplicité des ensembles considérés a un aspect séductif: 
elle suggère l’idée de les étudier en se basant seulement sur les 
particularités concrètes des éléments. Toutefois il est impossible 
de ne pas remarquer que ces ensembles ont de nombreux traits com- 
muns. Îl serait donc avantageux de commencer leur étude à partir de 
certains principes communs pour éviter au moins des répétitions fasti- 
dieuses et monotones en passant d’un ensemble à l’autre. Mais il y a 
encore cet espoir, certes, que si nous tombons sur un ensemble aux 
propriétés analogues, nous pourrons y reporter immédiatement tous 
les résultats déjà fournis par l'étude antérieure. 
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Récapitulons les faits déjà connus et communs aux vecteurs qui 
forment l’un des trois ensembles considérés. 

A. A chaque couple de vecteurs x, y correspond un vecteur x + y 
appelé somme de zx et y; de plus: 

1) l’addition est commutative: z + y = y + zx; 

2) l'addition est associative: x + (y + z) = (x + y) + z; 

3) il existe l’élément nul unique 0 tel que x + 0 = x pour 
tout vecteur zx; 

4) pour chaque vecteur zx il existe un vecteur opposé unique —z 
tel que x + (—zx) = 0. 

B. À chaque couple a, x, où « est un nombre et x un vecteur, 
correspond un vecteur ax appelé produit de «a et z; de plus: 

1) la multiplication par les nombres est associative: a (Br) = 
= (af) z; 

2) 1-x = x pour tout vecteur x. 

C. L'addition et la multiplication sont liées par les propriétés 
suivantes : 

1) la multiplication par un nombre est distributive par rapport à 
l'addition des vecteurs: a (x + y) = ax + ay; 

2) la multiplication par un vecteur est distributive par rapport 
à l'addition des nombres: (a + B) x — ar + zx. 

De même que dans le cas d’un corps, tous ces faits ne prétendent 
pas à l’indépendance logique. Les propriétés À décrivent l'ensemble 
des vecteurs du point de vue de l'addition en indiquant que, par 
rapport à cette opération, l’ensemble est un groupe abélien. Les 
propriétés B décrivent cet ensemble du point de vue de la multipli- 
cation d’un vecteur par un nombre. Les propriétés C décrivent la 
liaison entre les deux opérations. 

Examinons maintenant un ensemble Æ et un corps P de nature 
quelconque. Appelons l’ensemble Æ espace vectoriel sur le corps P 
si les axiomes À, B, C étant respectées, les opérations d’addition et 
de multiplication par des nombres de P sont définies pour tous les 
éléments de X. Cette terminologie nous autorise de dire que les 
ensembles des vecteurs colinéaires, des vecteurs coplanaires et de 
tous les vecteurs de l’espace sont des espaces vectoriels sur le corps 
des nombres réels. 

Nous donnerons aux éléments de tout espace vectoriel le nom 
de vecteurs, bien que leur nature puisse être tout autre que celle des 
seoments orientés. Les idées géométriques associées à ce terme de 
« vecteurs » nous aideront à comprendre et souvent à prévoir les 
résullats nécessaires, ainsi qu'à découvrir une interprétation géo- 
métrique, qui n’est pas toujours évidente, de tel ou tel fait. 

Les vecteurs d’un espace vectoriel seront toujours notés par des 
minuscules latines, et les nombres par les minuscules grecques. Nous 
dirons qu'un espace vectoriel est rationnel, réel ou complexe suivant 
que le corps P est le corps des nombres rationnels, des nombres réels 
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ou des nombres complexes, et emploierons pour cet espace respec- 
tivement les notations D, R et C. Le fait que l'appellation et la 
notation ne comportent aucune référence aux éléments de l’espace 
lui-même a un sens profond dont on parlera plus loin. 

Avant de passer à la discussion détaillée des espaces vectoriels, 
voici les corollaires les plus simples du fait d’existence de l’addition 
et de la multiplication par un nombre. Ils concernent surtout les 
vecteurs nul et opposé. 

Dans tout espace vectoriel chaque élément x donne lieu à l’éga- 
lité 

Oz = 0, 
où le symbole 0 dans le second membre désigne le nombre réel nul, 
et dans le premier, le vecteur nul. Pour démontrer cette relation 
considérons l'élément 0-x + z. On a 

Oxz+z=0z+i-z = (0+1)z = 1-27 = 7. 
Donc, 
z=0-z<+z. 

En ajoutant aux deux membres de l'égalité l'élément —zx, il vient 

Oz + (—2) = (0x + 2) + (—2) = Oz + (x + (—2)) = 

= 0x + 0 = 0-z. 
A présent il est facile d'exprimer d’une façon explicite l'élément 
opposé —zx par l'élément z lui-même: 
—zxz = (—i) z. 

La validité de cette formule se déduit des relations bien simples 

z+(—1)z=1z+(—1)z = A —1)z = 0.2 = 0. 
C’est ce qui justifie à son tour les relations 

—(az) = (—a) x = a (—z), 

puisque 

—(ax) = (—1) (az) = (—a) z = a ((—1) x) = a (—2). 

Rappelons que d’après la définition de la soustraction, zx — y — 
—= z + (—y) pour tout couple de vecteurs z et y. L’expression expli- 
cite du vecteur opposé justifie également les lois distributives de la 


différence. En effet, quels que soient les nombres a, B et les vecteurs 
Z, y, On a 


(a — B) z = ax + (—B) z = ax + (—BPz)) = az — Pz, 
a(r—y)=a(z + (—1) y) = ax + (—a) y — 
= ax + (—(ay)) = ax — ay. 
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On en tire, en particulier, que pour tout «a 


a-0 = 0, 
étant donné que 


a-0=a(x— zx) = ax — ax = ax + (—ax) = 


Enfin, le dernier corollaire. Si un nombre « et un vecteur x véri- 
fient la relation 


alors, soit «a = 0, soit x = 0. En effet, si l’égalité (10.1) est observée, 
elle donne lieu à l’une des deux éventualités suivantes: ou bien a = 
= 0, ou bien a = 0. Le cas a — 0 confirme notre assertion. Soit 
maintenant a — 0; alors 


z=1Î.r— (a) z= (ur) = +00. 


On en tire, notamment, que dans tout espace vectoriel, toute 
égalité peut être formellement réduite par un facteur commun non 
nul indépendamment du fait si ce facteur est un nombre ou un vec- 
teur. En effet, si ax = fx et x = 0, alors (a — $) x = 0 et a — B — 
= 0, c’est-à-dire a = $. Et si az = ay et a = 0, alors a (x — y) — 
= 0et x — y = 0, c'est-à-dire x = y 

Ainsi en ce qui concerne la multiplication, l'addition et la sous- 
traction, toutes les règles usuelles des transformations équivalentes des 
expressions algébriques sont valables. Dans ce qui suit ces règles ne 
seront plus mentionnées spécialement. 

En terminant la première initiation aux espaces vectoriels, si- 
gnalons seulement que ce n’est pas par hasard que les propriétés des 
opérations sur le corps et sur l’espace vectoriel sont notées d’une 
même manière. Les axiomes d’un corps et d’un espace vectoriel sur 
un corps possèdent des traits d’une ressemblance (et, dans la même 
mesure, d’une différence) frappante. Il faut donc que le lecteur se 
penche sur cette question. 


Exercices. Montrer que les ensembles suivants sont des espaces vectoriels. 
Partout l'appellation de l’opération traduit non pas la notation, mais le con- 
tenu. 

1. Corps: nombres réels; ensemble: nombres réels: addition: addition 
des nombres réels ; multiplication par un nombre : multiplication d’un nombre 
réel par un nombre réel. 

2. Corps: nombres réels; ensemble: nombres complexes; addition: addi- 
tion des nombres complexes : multi nur par un nombre : multiplication 
d'un nombre complexe par un nom bre 

3. Corps: nombres rationnels; a Le nombres réels: addition: addi- 
tion des nombres réels: multiplication par un nombre: multiplication d’un 
nombre réel par un nombre rationnel. 
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4. Corps: un corps quelconque ; ensemble : un vecteur a ; addition : addition 
définie par la règle a + a — a; multiplication par un nombre: multiplication 
du vecteur a par un nombre quelconque &, définie par la règle œa= a. 

5. Corps: nombres réels; ensemble: polynômes à coefficients réels par 
rapport à une variable t, y compris des constantes; addition: addition des 
polynômes; multiplication par un nombre: multiplication d’un polynôme 
par un nombre réel. 


6. Corps: nombres rationnels ; ensemble : nombres de la forme a + bW2+ 


ec V3+ d V 5, où a, b, c, d sont des nombres rationnels; addition: addition 
des nombres de la forme donnée; multiplication par un nombre: multiplica- 
tion du nombre de la forme donnée par un nombre rationnel. 

7. Corps: un corps quelconque ; ensemble : ce même corps; addition : addi- 
tion des éléments (vecteurs!) du corps; multiplication par un nombre: multi- 
plication d'un élément (vecteur!) par un élément (nombre!) du corps. 


$ 11. Sommes et produits finis 


Les corps et les espaces vectoriels seront les ensembles qu’il 
nous faudra surtout envisager par la suite. Ces ensembles sont munis 
de deux opérations: l'addition et la multiplication. Si on effectue 
un grand nombre d'opérations sur les éléments, on obtient des expres- 
sions contenant un nombre important de termes et de facteurs. Pour 
rendre leur écriture plus commode, nous introduirons une notation 
correspondante, tout en supposant que l’addition et la multiplication 
soient des opérations commutatives et associatives. 

Soit un nombre fini d'éléments pas nécessairement différents. 
Admettons que tous les éléments sont numérotés d’une certaine fa- 
çon et affectés de numéros qui varient consécutivement d’un nombre 
k jusqu'à un nombre p. Les éléments seront désignés par une même 
lettre affectée d'un numéro. Dans la notation, ce numéro que nous 
appellerons indice, peut s’écrire n'importe où: on peut le mettre 
près de la lettre entre parenthèses, près de la lettre en bas ou en 
haut, etc., cela n’a aucune importance. Le plus souvent nous l'écri- 
rons en bas à droite de la lettre. 

| La somme des éléments ax, &äxj1, - - ., @p Sera notée de la façon 
suivante : 


P 
a+ amt...+a À a. (11.1) 


L'indice à s'appelle ici indice de sommation. Rien ne changera, bien 
sûr, si nous le désignons par une autre lettre. Parfois sous le signe 
de sommation on notera explicitement toute la collection de valeurs 
de l'indice de sommation. Par exemple, la somme (11.1) pourrait 
s'écrire 


ap + Apr + + ap = » &;. 


RLISP 
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Il est évident que si chaque élément a; est égal au produit d'un 
élément b, par un élément a, où a ne dépend pas de i, alors 


P p 


c'est-à-dire qu'on peut faire sortir du signe de la sommation un 
facteur indépendant de l'indice de sommation. 

Supposons maintenant que les éléments sont afféctés de deux 
indices dont chacun varie indépendamment. Adoptons pour ces 
éléments la notation a;;, et soit, par exemple, k<i<p,m<j< 
< n. Disposons les éléments sous la forme d’un tableau rectangu- 
laire 


Cm AR, m+1 ee hn 


Œh#1,m h+i,m}tt + Œh+1, ns 


pm hp, m+i ee Œpn: 
Il est clair que quel que soit l’ordre de sommation, le résultat 


sera le même. C’est pourquoi, compte tenu de la notation de la som- 
me, on obtient 
(axm + a, m+1 +... + ann) + (art, m + A4, m4 + Hs + Ap+#1, n) NÉ 
….. + (pm + Gp, mhi tee. + Gpn) = 
ñn ñn n P ñn 
— D y + D Apt + eee + D pj = D (> a). 
j=m J=m j=m i=R j=m 
Par ailleurs, cette même somme vaut 
(aim + Gn+s,m + + +. + Gpm) “+ 
(ax, m+s ht, mi ee + Gp, mas) + ee H(Qun aus, n + + + + Gpn)= 
LE ee 
= 2 Gim+ à dim +... + > din = à (> a). 
i=h i=R 1—=hÀ j=m i=Rk 
Par conséquent 


TN AS 
> (> as) = à (> CM 
i=R j=m J=m i=RhR 


Si nous Convenons que la sommation se fait toujours de proche 
en proche, de droite à gauche par rapport aux indices des sommes, 
les parenthèses peuvent être omises et on obtient finalement 


ue 5 à 
à 2 ay = À 2 dij- 


i=k j=m j=m i=kR 
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Cela signifie que dans la sommation sur deux indices, l’ordre de 
sommation peut changer. Si, par exemple, a;; = a;b;;, où a; ne 
dépend pas de l'indice j, il vient 


Des résultats analogues ont lieu pour des sommes avec n'importe 
quel nombre fini d’indices. 
Le produit des éléments az, ap+x, - - ., ah est noté 


4 
AR AR+1 ee ah — Il &- 
1—= 


Si maintenant a; — ab,;, on a 
P 
fl ab, = aP-k#i [ b.. 
ik i= 


De même que pour la sommation, le calcul d'un produit par rapport 
à deux indices permet de changer l’ordre de la multiplication, c'est- 


a-dire 
P On mn P 
LL LE = I I a. 
i=kR j=m j=m i=k 


Tous ces faits se démontrent selon le même schéma que pour la som- 
mation des nombres. 


Exercices. Calculer les expressions suivantes: 


ñn n n n 
ÿ» 1, > {, >, E, > 8 (1—1), 
i= 1 t=1 1=1{ 


= 


n 


n m n M m ? 
D Sr, D OUG+S, D D OÙ (ir, 


r=1 j—=1 i=1 5—1 4=1 j—1 R=1 

n n n On | n M pP 

[[2, [10, [[ [f2é, ID IL IT 2x. 
ti p=i i=1 j=1 = 1 j=1 R=1 


2= J R= 


$ 12. Calculs approchés 


Les ensembles examinés sont largement utilisés dans les recher- 
ches théoriques les plus variées. Pour obtenir un résultat, on effec- 
tue presque toujours des opérations sur les éléments des ensembles 
eux-mêmes. Les calculs qui s'imposent le plus souvent portent sur 


$ 12] CALCULS APPROCHES A 


les éléments des corps numériques. La réalisation pratique de ces cal- 
culs se distingue par une particularité importante sur laquelle nous 
voulons attirer l'attention du lecteur. 

Considérons, pour fixer les idées, le corps des nombres réels. 
Supposons que chaque nombre soit mis sous la forme d’un dévelop- 
pement décimal illimité. Pas un homme ni une calculatrice électro- 
nique, quelle que soit sa perfection, ne peuvent opérer avec ces déve- 
loppements. Pour cette raison chaque développement est remplacé 
dans la pratique par une fraction décimale finie voisine ou par un 
nombre rationnel convenable. 

Ainsi, un nombre réel exact est remplacé par un nombre appro- 
ché. Il est assez fréquent dans des recherches théoriques, qui sous- 
entendent une donnée des nombres exacte, qu’une expression est 
remplacée par une expression égale mais notée sous une forme diffé- 
rente. Bien sür, une telle substitution ne peut donner lieu à des 
objections, ni même à des doutes. Mais si nous voulons calculer une 
expression à l’aide des nombres donnés approximativement, la forme 
sous laquelle est donnée l'expression n'est rien moins qu'indiffé- 
rente. 

Voici un exemple bien simple. On vérifie aisément que si la 


donnée du nombre V2 est exacte, 


(V2 — 1}° = 99 — 70 V 2. (12.1) 


Puisque V 2 = 1,4142..., les nombres 7/5 = 1,4 et 17/12 — 1,4166.. 


peuvent être considérés comme des valeurs approchées de V 2. Mais 
en portant 7/5 dans le premier et le second membres de (12.1), on 
obtient 0,00509... et 1,0 respectivement. Pour 17/22 on a 0,00523... 
et —0,1666... Les résultats de la substitution se distinguent nette- 
ment entre eux et on ne voit pas tout de suite lequel s’approche 
plus du résultat exact. Cet exemple montre qu'il faut être très prudent 
en travaillant avec les nombres approchés. 

Nous n'avons examiné que les nombres approchés provenant de 
l'arrondissement des données exactes. Mais il existe encore bien 
d’autres sources de ces nombres. Par exemple, les données initiales 
des calculs sont souvent fournies par les expériences; or, la préci- 
sion des résultats que permet une expérience est limitée. Même des 
opérations aussi simples que la multiplication et la division peu- 
vent faire accroître sensiblement le nombre de rangs des développe- 
ments. Nous serons donc contraints de rejeter une partie de ces rangs 
dans les résultats intermédiaires, c’est-à-dire de remplacer, encore 
certains nombres par des nombres approchés, etc. 

Une étude détaillée des calculs approchés dépasse le cadre de 
notre cours. Cependant, nous reviendrons assez souvent à la discus- 
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sion des différences entre les calculs théoriques et pratiques. Cette 
nécessité est due au fait qu'en général les calculs théoriques ne peu- 
vent être réalisés exactement. 


Exercices 


1. Par quelle fraction décimale finie doit-on approcher V/2 pour que le 
<alcul du premier et du second membres de (12.1) donne un résultat où coinci-: 
dent les six premiers rangs? 

2. Supposons que le résultat de chaque opération sur deux nombres réels 
est arrondi d'apres une loi connue quelconque jusqu’à ? rangs après la virgule. 
Dans ces conditions les opérations gardent-elles les propriétés commutatives 
et associatives? 

3. Les lois distributives se conservent-elles dans les conditions de l'exercice 
précédent ? 

&. Quelle sera votre conclusion si les réponses aux exercices 2 et 3 sont 
négatives? 


CHAPITRE 2 


STRUCTURE DE L'ESPACE VECTORIEL 


$ 13. Combinaisons et enveloppes linéaires 


Soit À un espace vectoriel sur un corps P dans lequel on choisit 
un nombre fini de vecteurs arbitraires e4, €», . . ., e, différents ou 
non. Appelons-les système de vecteurs. L'un de deux systèmes de 
vecteurs est dit sous-système par rapport à l’autre s’il contient cer- 
tains vecteurs appartenant à ce dernier et ne contient aucun autre 
vecteur. 

Supposons qu'on additionne ou multiplie par des nombres les 
vecteurs du système donné ainsi que des vecteurs qui s’en déduisent 
par ces opérations. Il est clair que tout vecteur x de la forme 


ZT —= Guey + Quea + ... + ae, (13.1) 
OÙ js Œay + + + Œn SOnt des nombres du corps P, s'obtient à l’aide 
de ces opérations à partir des vecteurs €, €:, . .., €, du système 


donné. De plus, que Ilque soit l’ordre de ces opérations, on n'obtient 
que des vecteurs (13.1). 

Pour un vecteur x de (13.1) on dit qu’il s'exprime linéairement 
par les vecteurs e1, €, . . ., e,. Le second membre de (13.1) s’appelle 


combinaison linéaire de ces vecteurs, les nombres @y, @2, . . ., @n, 
coefficients de la combinaison linéaire. 
Fixons un système de vecteurs e1, €, . .- ., €, et laissons les 


coefficients de leurs combinaisons linéaires prendre n’importe quel- 
les valeurs du corps P. On définit ainsi un ensemble des vecteurs 
sur XÀ. Cet ensemble s'appelle enveloppe linéaire des vecteurs 
Ejy ar - + + En notée L (ey, e:, . . ., en). 

Notre intérêt pour les enveloppes linéaires est dû à deux circons- 
tances. Premièrement, la structure de toute enveloppe linéaire est 
très simple: c’est l’ensemble de toutes les combinaisons linéaires 
des vecteurs du système donné. Deuxièmement, l'enveloppe linéaire 
de tout système de vecteurs d’un espace vectoriel est elle-même un 
espace vectoriel. 

En effet, il est presque évident que tous les axiomes de l'espace 
vectoriel sont respectés. Il n’y a que les axiomes relatifs aux vecteurs 
nul et opposé qui demandent peut-être une explication. Le vecteur 
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nul appartient bien à toute enveloppe linéaire et correspond aux 
valeurs nulles des coefficients de la combinaison linéaire, c'est-à- 
dire 


0 = 0e, + O-es + ... + 0e. 
Le vecteur opposé du vecteur (13.1) sera 
= (— QG) € + (—Gs) ee + : .. + (— An) en. 


L'unicité des vecteurs nul et opposé s'ensuit de leur unicité en tant 
qu'éléments de l’espace vectoriel X. 

Remarquons que l'enveloppe linéaire des vecteurs e,, e:, . . ., en 
est « le plus petit » espace vectoriel contenant ces vecteurs. En effet, 
l'enveloppe linéaire elle-même n'est composée que des combinaisons 
linéaires des vecteurs e,, e:, . . ., e,; or, tout espace vectoriel con- 
tenant les vecteurs e:, e3, . . ., e, est censé de contenir également 
toutes leurs combinaisons linéaires. 

Ainsi, dans le cas général, tout espace vectoriel contient un nom- 
bre infini d’autres espaces vectoriels que sont les enveloppes liné- 
aires. 

On se demande maintenant dans quelles conditions les envelop- 
pes linéaires de deux systèmes différents de vecteurs se composent de 
mêmes vecteurs de l’espace initial ? 

Quel est le nombre minimal de vecteurs qui définit une enveloppe 
linéaire ? 

L'espace vectoriel initial est-il une enveloppe linéaire de ses 
vecteurs quelconques ? 

La réponse à ces questions ainsi qu'à bien d’autres sera donnée 
dans ce qui suit. À cet effet nous utiliserons souvent la notion de 
combinaison linéaire et surtout la propriété de sa transitivité. Celle- 
ci signifie que, si un vecteur z est une combinaison linéaire des vec- 
teurs Zy, Tes + - - Tr, et Si chacun de ces derniers est à son tour une 
combinaison linéaire des vecteurs ÿ1, Ya, - - -, Ys, le vecteur z lui- 
même peut être représenté comme une combinaison linéaire des 
vecteurs Yy, Yas + + -, Ye Pour démontrer cette propriété, supposons 
que 


2= D B;z; (13.2) 


i=1 


et, de plus, pour tout i, 1<i<vr, 
_* 


T4 ee Vus 


où BP; et Y:y sont des nombres du corps P. 
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En portant l'expression de x; dans le second membre de (13.2) et 
en utilisant les propriétés des sommes finies, on obtient 


= D Pire D Bi Dvog= D» D Bivys= 
i=1 i=1  j=1 1=1 2=1 


Brvisys = À (2 Bivis) vs = à Ejyy, 


où les coefficients E; traduisent les expressions 


T 


Ej = 2 Bivi- 


1=1 


Ainsi, les combinaisons linéaires sont effectivement transitives. 


- 
j—=1 i—1 


S 
[ 


Exercices 


1. Les enveloppes linéaires des systèmes d’un, de deux et d’un plus grand 


nombre segments orientés, que représentent-elles dans l'espace des segments 
orientés 


2. Considérons l’espace vectoriel des polynômes dépendant d’une variable t 
et donnés sur le corps des nombres réels. L'enveloppe linéaire du système de 
vecteurs t® + 4, # L 1, 1, que représente-t-elle? 

3. Dans quel espace toutes les enveloppes linéaires se confondent-elles 
avec l’espace lui-même? 


4. Prouver que l’espace vectoriel de tous les segments orientés ne peut 
être une enveloppe linéaire d'aucun couple de segments orientés. 


$ 14. Dépendance linéaire 


Considérons encore les vecteurs arbitraires e,, €:, . .., €, dans 
un espace vectoriel. Il se peut que l’un d’eux s'exprime linéairement 
par tous les autres. Supposons, par exemple, que ce soit le vecteur e.. 
Alors, chacun des vecteurs e, ex, . . ., €, s'exprime linéairement par 
Cas gr + + +» En. Aussi, toute combinaison linéaire des vecteurs 
Es €2s + - +» En eSt également une combinaison linéaire des vecteurs 
Ezy C3 + - + En. Il en résulte que les enveloppes linéaires des vec- 
teurs €1, Es + - -9 En Ot €2, Es + - -) En COincident. 

Supposons ensuite que parmi les vecteurs e€:, €3, ..., Eh un 
certain vecteur, par exemple, e:, soit également exprimé linéaire- 
ment par les autres vecteurs. En reprenant notre raisonnement, nous 
en tirons que toute combinaison linéaire des vecteurs e,, es, . . ., en 
est aussi une combinaison linéaire des vecteurs e;, &, . . ., en. Si 
nous poursuivons ainsi, nous passons finalement du système 
Eyy C2 + + + En à Un système où l'élimination d’un vecteur devient 
impossible. L'enveloppe linéaire de ce dernier système se confond 
évidemment avec l’enveloppe linéaire des vecteurs e:, e2, 


e e °9 En. 
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Par ailleurs, nous pouvons dire que si parmi les vecteurs e1, €», . .. 
... €n il Ÿ à au moins un vecteur non nul, alors ou bien le nouveau 
système de vecteurs se compose d'un seul vecteur non nul, ou bien aucun 
de ses vecteurs ne s'exprime linéairement par les autres vecteurs. 

On dit qu'un tel système de vecteurs est linéairement indépen- 
dant ou libre. 

Un système qui n’est pas linéairement indépendant est dit linéai- 
rement dépendant ou lié. En particulier, cette définition entraîne 
qu'un système composé seulement d’un vecteur nul est linéairement 
dépendant. La dépendance et l'indépendance linéaires sont les 
propriétés d'un système de vecteurs. Néanmoins les adjectifs cor- 
respondants sont souvent rapportés aux vecteurs eux-mêmes. C’est 
pourquoi au lieu de «système linéairement] indépendant de vec- 
teurs » nous dirons parfois « système de vecteurs linéairement indé- 
pendants », etc. 

Nous avons donc démontré le 

Lemme 14.1. Soit un système linéairement dépendant 
C1» sy + + +» En de vecteurs non tous nuls; on y trouve un sous-système 
linéairement indépendant de vecteurs par lesquels s'exprime linéaire- 
ment n'importe lequel des vecteurs ej, e:, . . ., e,. 

La dépendance (ou l’indépendance) linéaire d’un système 
Es @2s - - : En est déterminée par une circonstance de prime abord 
imprévue. Nous avons déjà dit qu'un vecteur nul appartient à 
toute enveloppe linéaire représentant la combinaison linéaire (13.1) 
à coefficients nuls. Or, il peut s’avérer qu'il y ait une autre expres- 
sion linéaire du vecteur nul par les vecteurs e,, €:, . . ., eh, C’est-à- 
dire qu'il peut être défini par une autre collection de coefficients de 
Ja combinaison linéaire. L'indépendance linéaire des vecteurs 
Es @es - + «» En St étroitement liée à l’unicité de la représentation 
de l’élément nul par ces vecteurs. On vérifie notamment le 

Théorème 14.1. Un système de vecteurs e;, e:, . .., e, est 
linéairement indépendant si et seulement si l'égalité 


(02121 + (o TA + ss + An£n —= 0 (14.1) 


entraine que tous les coefficients de la combinaison linéaire sont nuls. 

Démonstration. Soitn — 1.Sie, = 0, alors, comme nous 
l’avons déjà dit, la relation aie, — 0 amène a; = 0. Et, si l’égalité 
Ge, = 0 exige que le coefficient a; soit nul, il est évident que e; 
ne peut être nul. 

Considérons maintenant le cas rz > 2. Supposons que notre sys- 
tème de vecteurs soit linéairement indépendant et que l'égalité 
(14.1) soit vérifiée pour une certaine collection de coefficients parmi 
lesquels il y a au moins un différent de zéro. Soit, par exemple, 
ü1 = 0. Alors, on tire de (14.1) 

a=(-Æ)e+(-%) Et... +(-7) En 


&i 
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c'est-à-dire le vecteur e, s'exprime linéairement par les autres vec- 
teurs du système. Cette contradiction avec la condition de l’indé- 
pendance linéaire d’un système traduit le fait que parmi les coeffi- 
cients qui vérifient (14.1) il ne peut y avoir de coefficients non nuls. 

Si l'égalité (14.1) entraîne que tous les coefficients sont nuls, le 
système de vecteurs ne peut être linéairement dépendant. En effet, 
raisonnons par l’absurde et soit, par exemple, le vecteur e, exprimé 
linéairement par les autres vecteurs, c'est-à-dire 


mn Pre: a Pses + + Pnen- 


Alors, l'égalité 1) est vérifiée par les coefficients a1 = —1, a+ — 
= $B2, ..., &«, — BP, parmi lesquels au moins un est non nul. Le 
théorème est démontré. 

Ce théorème est d’un usage si fréquent dans les recherches que la 
condition de l’indépendance linéaire qu'il établit est le plus souvent 
considérée en tant que définition de l’indépendance linéaire. 

Indiquons deux propriétés bien simples des systèmes de vecteurs 
associées à la dépendance linéaire. 


Lemme 14.2. Si quelques-uns des vecteurs e;, €, . . ., e, sont 
linéairement dépendants, le système ex, €:, . ., e, tout entier l'est 
également. 


Démonstration. Nous pouvons adopter sans limiter la 
généralité que les vecteurs linéairement dépendants sont les premiers 
vecteurs €, €», « - ., x. Il existe donc des nombres a, 2, . . ., Gx 
parmi lesquels il y en a ceux qui sont non nuls, tels que 


ex + Guéa + ... + are = 0. 
On en tire l'égalité 
Que + Gus + ... + Guen + Oeenrsa +... + Ores = 0. 
Or, cette égalité traduit la dépendance linéaire des vecteurs e1, e:, . .. 


., En du fait que parmi les scalaires a, @s, . . ., Gun, O, . . ., O 
il y en a non nuls. 

Lemme 14.3. Si parmi les vecteurs e1, e:, . . ., e, il y a au 
moins un vecteur nul, le système e1, 2, . . ., €, tout entier est linéaire- 


ment dépendant. 

Démonstration. En effet, le système composé d'un vec- 
teur nul est linéairement dépendant. C'est pourquoi la propriété 
qui vient d’être démontrée entraîne la dépendance linéaire du sys- 
tème tout entier. 

Le théorème suivant est le résultat le plus important dans le 
domaine de dépendance linéaire. 

Théorème 14.2. Pour que les vecteurs ey, 82, . - ., €, Soient 
linéairement dépendants il faut et il suffit que ou bien e; = 0, ou bien 
un vecteur ex, 2 k<n, soit combinaison linéaire des vecteurs pré- 


cédents. 
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Démonstration. Supposons que les vecteurs €, €2, . .. 
- - +» En Soient linéairement dépendants. Alors, les coefficients de 
(14.1) sont non tous nuls. Soit a, le dernier coefficient non nul. Si 
= 1, cela signifie que e: = 0. Soit, maintenant k > 1. Alors, 
l'égalité 
Gex + Gsla + . .. + axex = 0 
conduit à 
Le 4 (4 Pa 
mn (—E)at(—B)at + (2) ou 


Œh 


Ainsi, on a démontré la nécessité. La réciproque est évidente, 
puisque le cas où e, — 0 de même que le cas où le vecteur e; s’ex- 
prime linéairement par les vecteurs précédents, traduit la dépendan- 
ce linéaire des premiers vecteurs de ex, es, . - .» €n- Or ceci entraîne 
la dépendance linéaire du système tout entier. 


Exercices 


1. Montrer que si l’un quelconque des vecteurs d’un espace vectoriel se 

présente d’une façon unique comme combinaison linéaire des vecteurs e;, 62, . .. 
.. €n, Ce Système est alors linéairement indépendant. 

2. Montrer que si un système de vecteurs e;, 62, . .., eh est linéairement 
indépendant, tout vecteur de l'enveloppe linéaire de ces vecteurs se présente 
de façon unique sous la forme de leur combinaison linéaire. 

3. Prouver que pour qu’un système de vecteurs e;, €, . .- ., eh Soit linéaire- 
ment dépendant il faut et il suffit que, ou bien e, — 0, ou bien un vecteu- 
ep, 1LkL nr — 1, soit combinaison linéaire des vecteurs qui le suivent. 

4. Considérons l'espace vectoriel des polynômes d’une variable t sur le 
corps des nombres réels. Montrer que, pour tout n, le système des vecteurs 
4,1, 1%, ..., tr est linéairement indépendant. 

5. Montrer qu'un système composé de deux segments orientés non coli- 
néaires est linéairement indépendant. 


$ 15. Systèmes équivalents de vecteurs 


Considérons deux systèmes de vecteurs d’un espace vectoriel 
K. Supposons que leurs enveloppes linéaires se confondent et cons- 
tituent un ensemble Z. Tout vecteur de ces deux systèmes appartient 
bien à l’ensemble L et, de plus, chaque vecteur de Z peut être mis 
sous la forme d’une combinaison linéaire tant des vecteurs de l’un 
des systèmes que des vecteurs de l’autre. Par conséquent, dans cette 
situation on peut dire que: 

Deux systèmes de vecteurs possèdent cette propriété que tout vecteur 
de chaque système s'exprime linéairement par les vecteurs de l'autre. 

Deux systèmes possédant cette propriété sont dits équivalents. 

Ce qui vient d’être dit entraîne que si les enveloppes de deux sys- 
tèmes coïncident, ces systèmes sont équivalents. Soient à présent, 
deux systèmes équivalents quelconques. En vertu de la transitivité 
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de combinaison linéaire, toute combinaison linéaire des vecteurs de 
l’un des systèmes peut être mise sous la forme d’une combinaison 
linéaire des vecteurs de l’autre, c’est-à-dire les enveloppes des deux 
systèmes se confondent. Ainsi, on a le 

Lemme 15.1. Pour que les enveloppes linéaires de deux systèmes 
de vecteurs coïncident, il faut et il suffit que ces systèmes soient équiva- 
lents. 

Remarquons que la notion d'équivalence de deux systèmes de 
vecteurs est une relation d'équivalence. Sa reflexivité est évidente, 
puisque tout ensemble est équivalent à lui-même, la symétrie résulte 
de la définition des systèmes équivalents, et la transitivité, de la 
transitivité des combinaisons linéaires. Il s'ensuit que l’ensemble 
de tous les systèmes de vecteurs d'un espace vectoriel quelconque peut 
être partagé en classes des systèmes équivalents. I] importe de souligner 
qu’à tous les systèmes de chaque classe correspond une et seulement 
une enveloppe linéaire. 

Dans le cas général on ne peut rien dire sur la relation entre les 
nombres de vecteurs des systèmes équivalents. Mais si au moins l’un 
des deux systèmes équivalents est linéairement indépendant, on 
peut en déduire certaines conclusions sur le nombre de vecteurs. 
Celles-ci sont fondées sur le 

Théorème 15.1. Si chaque vecteur d'un système linéairement 
indépendant 1, €: - +» En S’exprime linéairement par les vecteurs 
Yrs Vas - + +9 Um» alors n < m. 

Démonstration. D'après l'hypothèse du théorème, le 
vecteur e, s'exprime linéairement par les vecteurs y, y2, .- + ., Um; 
par conséquent, le système 


Ens Vis Yas + + -) Um (15.1) 


est linéairement dépendant. Le vecteur e, étant non nul, d’après le 
théorème 14.2 il existe un vecteur y, de (15.1), combinaison liné- 


aire des vecteurs précédents. En éliminant ce vecteur, on obtient 
le système 


Ens Wir eee) Uints Yitis cc Um: (15.2) 


À présent, utilisons la transitivité d’une combinaison linéaire pour 
qu'il soit facile de montrer que chacun des vecteurs 61, e2, . 
s'exprime linéairement par les vecteurs (15.2). 

Ajoutons à gauche aux vecteurs (15.2) le vecteur e, . Cette fois 
encore on conclut que le système 


en 


En=ts Ens Us coes Ying Yixis ce Ym (15.3) 


est linéairement dépendant. Le vecteur e,_, est non nul; c'est pour- 
quoi, d’après le théorème 14.2, l’un des autres vecteurs (15.3) est 
k—01090 
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combinaison linéaire des vecteurs précédents. Ce vecteur ne peut 
être e,, sinon le système de deux vecteurs e,_1, e, serait linéaire- 
ment dépendant, donc, le système des vecteurs €1, €2, - . ., en tout 
entier le serait aussi. Ainsi, un vecteur y; de (15.3) s'exprime liné- 
airement par les vecteurs précédents. Si on l'élimine, on obtient 
encore un système par lequel s’exprime linéairement chacun des 
vecteurs €7, €2r - + -» En- 

En poursuivant ce processus, remarquons que les vecteurs 
Yis Y2y + + <> Ym ne peuvent être éliminés avant que soient ajoutés 
tous les vecteurs €, e2, . . ., €,. Dans le cas contraire, chacun des 
vecteurs €7, €, + : -» En S’exprime linéairement par une partie de 
vecteurs de ce même système, c’est-à-dire que le système tout entier 
doit être linéairement dépendant. Or, ceci contredit l’hypothèse 
du théorème; il s'ensuit que nr < m. 

Examinons les corollaires de ce théorème. Soient deux systèmes 
de vecteurs linéairement indépendants. D’après le théorème démon- 
tré, les vecteurs de chacun de ces systèmes ne sont pas plus nombreux 
que les vecteurs de l’autre. Par conséquent, 

Les systèmes équivalents linéairement indépendants contiennent le 
même nombre de vecteurs. 

Prenons ensuite n vecteurs arbitraires et construisons sur ces 
derniers l'enveloppe linéaire dans laquelle nous choisirons nr + 1 
vecteurs quelconques. Le nombre de ces vecteurs étant plus grand 
que celui de vecteurs donnés, ils ne peuvent être linéairement indé- 
pendants. Donc, 

N'importe quels n + 1 vecteurs de l'enveloppe linéaire d'un système 
de vecteurs sont linéairement dépendants. 

En termes des systèmes équivalents l'affirmation du lemme 14.1 
signifie que quel que soit un système de vecteurs non simultanément 
nuls, il contient un sous-système linéairement indépendant équiva- 
lent. Ce sous-système s'appelle base du système initial. 

Bien entendu, il se peut qu’un système possède plus d’une base. 
Toutes les bases des systèmes équivalents sont elles-mêmes des systè- 
mes équivalents. Le premier corollaire du théorème 15.1 entraîne 
qu'ils sont composés d’un même nombre de vecteurs. Ce nombre est 
une caractéristique de tous les systèmes équivalents et on l’appelle 
rang. Par définition, le rang d’un système de vecteurs nuls est nul. 

Considérons maintenant deux systèmes linéairement indépendants 
composés d’un même nombre de vecteurs. Remplaçons un vecteur 
quelconque du premier système par un vecteur du deuxième. Ensui- 
te, dans le système obtenu remplaçons de nouveau l’un des vecteurs 
par l’un des vecteurs restants du deuxième système, etc. Poursui- 
vons ce processus tant que le premier système ne soit complètement 
remplacé par le deuxième. Si la substitution est réalisée d'une façon 
arbitraire. il peut arriver que les systèmes intermédiaires soient 
linéairement dépendants. Toutefois, on vérifie le 
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Théorème 15.2. Le remplacement successif peut être réalisé 
de façon que tous les systèmes intermédiaires soient linéairement indé- 
pendants. 

Démonstration. Soient y, Ya, - - «, Yn OÙ Z19 Z2y + + +» Zn 
deux systèmes linéairement indépendants. Supposons que À vecteurs 
du premier système, où k > 0, soient déjà remplacés. Sans limiter 
la généralité, adoptons que les vecteurs y, . . ., y, sont rempla- 


cés par les vecteurs 21, . .., z, et que tous les systèmes obtenus, y 
compris 


Zis eve) Zhs Uh+is 0e: Un): 


sont linéairement indépendants. Cette hypothèse a lieu à l’avance 
pour k# = (0. 

Supposons ensuite que lorsqu'on remplace le vecteur yy+, par 
l'un quelconque des vecteurs 2441, + - -» Zn, tous les systèmes 


Zi, 00e) Zhs Zis UYUh+2: 0e Un 


soient linéairement dépendants pour i = À + 1, ..., n. Puisque 
le système 


Zts es Zho UYUh+2s 0e Un (15.4) 


est linéairement indépendant, il en résulte que les vecteurs z;, pour 
= k+1,..., nr s'expriment linéairement par ce système. Mais 
il en est de même des vecteurs z; pour à = 1,2, ...,k. Il s'ensuit 
donc que tous les vecteurs z,, . .., z, s'expriment linéairement par 
le système (15.4). Or, ceci est impossible en vertu du théorème (15.1). 
Donc, le processus de remplacement possède réellement la propriété 
prévue par l'énoncé du théorème. 


Exercices. Montrer que les transformations suivantes dites élémentaires 
d'un système de vecteurs conduisent à un système équivalent. 


4. Addition au système de vecteurs d'une combinaison linéaire de ces 


vecteurs. 


2. Elimination du système d'un vecteur quelconque, combinaison linéaire 
des vecteurs restants. 

3. Multiplication d'un vecteur du système par un nombre non nul. 

«4. Additien à un vecteur quelconque du système d'une combinaison linéaire 
quelconque des autres vecteurs. 

5. Permutation de deux vecteurs. 


$S 16. Base 


Soit un espace vectoriel contenant au moins un vecteur non 
nul. Dans un tel espace il existe bien un système linéairement indé- 
pendant composé au moins d’un vecteur non nul. Deux cas peuvent 
se présenter alors: ou bien il existe un système linéairement indé- 


4* 


52 STRUCTURE DE L'ESPACE VECTORIEL [CH. 2 


pendant possédant un nombre aussi grand que l’on veut de vecteurs, 
ou bien il en existe un qui contient un nombre maximal de vecteurs 
linéairement indépendants. Dans le premier cas l’espace vectoriel 
est dit de dimension infinie, et dans le deuxième de dimension finie. 

A l'exception de quelques exemples, nous nous attacherons tout 
le long de l'exposé à n'étudier que les espaces de dimension finie. En 
particulier, toute enveloppe linéaire d’un nombre fini de vecteurs 
d'un espace quelconque (non forcément de dimension finie) est un 
espace vectoriel de dimension finie. 

Supposons donc que dans un espace vectoriel À de dimension 
finie, les vecteurs e,, €, . .., €, constituent un système linéaire- 
ment indépendant au nombre maximal de vecteurs. Cela signifie 
que pour tout vecteur z de Æ le système e, €:, . . ., eh, z est liné- 
airement dépendant. D'après le théorème 14.2, le vecteur x s'expri- 
me linéairement par €, €:, .-.., e,. Le vecteur z étant arbitraire 
et les vecteurs e,, €, . . ., e, étant fixes, on peut dire que: 

Tout espace vectoriel de dimension finie est l'enveloppe linéaire 
d'un nombre fini de ses vecteurs. 

À présent, en étudiant les espaces vectoriels de dimension finie 
nous pouvons utiliser tous les résultats relatifs aux enveloppes liné- 
aires et aux systèmes équivalents des vecteurs. Donnons la défini- 
tion suivante. 

Un système linéairement indépendant de vecteurs par lequel s'ez- 
prime linéairement chaque vecteur de l’espace s'appelle base de l'es- 
pace. 

Nous associons la notion de base à un système qui contient un 
_nombre maximal de vecteurs linéairement indépendants. Il est pour- 
tant clair que toutes les bases d’un même espace vectoriel de dimension 
finie sont des systèmes linéairement indépendants équivalents. Nous 
savons que ces systèmes contiennent un même nombre de vecteurs. 
Par conséquent, le nombre de vecteurs de base est une caractéristique 
de l’espace vectoriel de dimension finie. Ce nombre s’appelle dimen- 
sion de l’espace vectoriel X, et on le note dim X. Si dim X = n, l’es- 
pace Æ est dit n-dimensionnel. Il est clair que 

Dans un espace vectoriel n-dimensionnel tout système linéairement 
indépendant de n vecteurs forme une base et tout système de n +1 
vecteurs est linéairement dépendant. 

Notons que partout dans ce qui précède nous avons supposé qu "un 
espace vectoriel contienne au moins un vecteur non nul. L'espace 
qui contient seulement le vecteur nul ne possède pas de base dans 
le sens que nous avons adopté et nous considérons par définition que 
sa dimension est nulle. 

La notion de base joue un grand rôle dans l’étude des espaces 
vectoriels de dimension finie et nous l’utiliserons souvent dans notre 
exposé; elle rend bien facile la description de la structure de tout 
espace vectoriel sur un corps quelconque P. En outre, elle permet de 
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construire un outil de calcul très efficace qui ramène les opérations 
sur les éléments de l’espace aux opérations correspondantes sur les 
nombres du corps P. 

Comme nous l'avons montré plus haut, tout vecteur zx de l’espace 
vectoriel À peut être mis sous la forme d’une combinaison linéaire 


Z = Grey + Orés + «+ + Ann (16.1) 


OÙ Œy» Œss + + + An SOnt des nombres de P, et e;, es, . . ., e, est une 
base de X. La combinaison linéaire (16.1) s’appelle décomposition 
du vecteur x suivant la base et les nombres &1, &s, . .., Gn, Coordonnées 
du vecteur x par rapport à cette base. Le fait qu'un vecteur x est 
donné par ses coordonnées se note de la façon suivante: 


ZT — (G1 Us + 9 On) 


Nous n’indiquerons pas en général la base par rapport à laquelle 
sont calculées les coordonnées si cela n’entraîne pas une ambiguïté. 

On montre aisément que pour tout vecteur x de K sa décomposition 
suivant une base est unique. On le prouve par le procédé souvent 
appliqué à des problèmes sur la dépendance linéaire. Supposons 
qu’en plus de (16.1), il existe une autre décomposition 


ZT — Pier ES Ba +... + fre (16.2) 


suivant la même base. En retranchant terme à terme (16.2) de (16.1), 
on obtient 


(@1 — Pa) Ex + (Ga — Pa) €2 + . . . + (an — Br) en = 0. 
Les vecteurs €, €+, . . ., €, étant linéairement indépendants, tous 
les coefficients de la combinaison linéaire sont nuls, donc les dé- 
compositions (16.1) et (16.2) coïncident. 

Ainsi, pour une base fixe d’un espace vectoriel X, tout vecteur 
de Æ est défini de façon univoque par la collection de ses coordonnées 
relatives à cette base. 

Soient maintenant x et y deux vecteurs quelconques de ÆX donnés 


par leurs coordonnées par rapport à la même base e;, e:, .. 


. « - °9 En ? 
c’est-à-dire 


TZ = Gé + Des + - . : + Œnens 
Y = Yita + LEZ + .….. + Ynên; 
alors, 


Z + y = (au + Va) En + (Ga + Va) Es +... + (an + Yn) En. 
Ensuite, pour tout nombre À de P on a 


Az = (Aa) e1 + (AG) es + . .. + (Aa) en. 
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I] s'ensuit que pour additionner deux vecteurs d'un espace vecto- 
riel on additionne leurs coordonnées par rapport à une base fire quel- 
conque, et pour multiplier un vecteur par un nombre, on multiplie par 
ce nombre toutes les coordonnées du vecteur. 


Exercices 


1. Montrer que le rang d'un système de vecteurs coïncide avec la dimen- 
sion de son enveloppe linéaire. 

2. Montrer que les systèmes équivalents de vecteurs ont le même rang. 

3. Montrer que si L, est une enveloppe linéaire des vecteurs d'une enve- 
loppe linéaire L.; alors dim L, << dim L.. 

4. Prouver que si L, est une enveloppe linéaire des vecteurs d'une enve- 


loppe linéaire L, et que dim L, — dim Z.,, alors les enveloppes linéaires coïn- 
cident. 


5. Prouver que l’espace vectoriel des polynômes à coefficients réels donné 
sur le corps des nombres réels est de dimension infinie. 


$ 17. Exemples simples des espaces vectoriels 


Les notions fondamentales de dépendance linéaire et de base 

peuvent être illustrées par des exemples bien simples mais gros 
d'enseignement si l’on choisit comme espaces vectoriels des ensem- 
bles numériques munis d'opérations ordinaires d’addition et de mul- 
tiplication. Pour ces ensembles, la vérification des axiomes de l’es- 
pace vectoriel est parfaitement simple et nous ne nous y attarderons 
donc pas. Pour les éléments d'un espace nous dirons toujours vec- 
teurs. 
.. Considérons l’espace vectoriel complexe qui est le groupe additif 
de tous les nombres complexes muni de multiplication par les nom- 
bres complexes. Il est clair que tout nombre z, non nul est un vecteur 
linéairement indépendant. Mais déjà deux vecteurs z, et z. non nuls 
sont toujours liés. Pour le prouver il suffit de chercher deux nombres 
complexes a, et a. non simultanément nuls tels que @;2, + &:22 = 
= 0. Or, cette égalité est manifeste pour &1 — —Z2:, G+ —= z3. Par 
conséquent, l’espace vectoriel considéré est unidimensionnel. 

Il en va quelque peu autrement pour l’espace vectoriel réel qui 
est le groupe additif de tous les nombres complexes muni de multi- 
plication par nombres réels. Dans ce cas on ne peut utiliser comme 
coefficients des combinaisons linéaires seuls les nombres réels: il 
s'ensuit que cet espace vectoriel ne peut pas être unidimensionnel. 
En effet, il n'existe pas de nombres réels &, et a, non simultané- 
ment nuls tels que la combinaison linéaire «21 + @222 s’annule, 
par exemple, pour z, = 1, z: — i. Le lecteur a le loisir de prouver 
à titre d'exercice que cet espace vectoriel est à deux dimensions. 

Il importe de souligner que tout en étant constitués de mêmes 
éléments, les deux espaces examinés présentent une différence de 
principe. 
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Il est clair à présent que l’espace vectoriel réel qui est le groupe 
additif de tous les nombres réels muni de multiplication par les 
nombres réels est un espace à une dimension. Considérons mainte- 
nant l’espace vectoriel rationnel qui est le groupe additif de tous 
les nombres réels muni de multiplication par des nombres ra- 
tionnels. 

De même que dans ce qui précède, cherchons à construire un 
système maximal de vecteurs indépendants r;, ra; ray - - . Il est clair 
qu'on peut prendre, par exemple, r, = 1. Puisque les coefficients 
Œp Xe ss - . . des combinaisons linéaires ne peuvent être que des 


nombres rationnels, il est impossible de représenter disons V2 par 
un nombre de la forme &;-1. L'espace ne peut donc pas être unidi- 


mensionnel. C'est pourquoi V2 peut être pris précisément comme un 
deuxième vecteur indépendant de l’unité. Toutefois, un nombre de 


LS . QN Ld 
la forme a1-1 + a2-V 2 ne peut pas servir à représenter, par exem- 


ple, y 2. 
En effet, supposons que pour certains @. et «a. rationnels l’éga- 


lité 2 — a + a.V 2 soit observée. En élevant les deux membres 
au carré, on obtient 


V2 = (ai + 20?) + 2ayo, V5 


ou 


2 (1 — 20400) ss Æ 


ai +24 


ce qui est impossible, étant donné que le premier membre est un 
nombre rationnel, et le deuxième, un nombre irrationnel. 

Ainsi, l’espace concerné ne peut être non plus à deux dimensions. 
Quelle est alors sa dimension? Tout étonnant que cela paraisse, c'est 
un espace de dimension infinie. Mais la démonstration de ce fait 
dépasse le cadre de notre exposé. 

L'attention particulière que nous avons porté aux espaces de 
petite dimension s'explique par la possibilité qu'ils présentent de 
construire des espaces de dimension quelconque. Or, c’est là un 
sujet que nous traiterons plus loin. 


Exercices 


1. Quelle est la dimension de l'espace vectoriel des nombres rationnels 
sur le corps des nombres rationnels? 

2. Construire des systèmes de vecteurs lintairement indépendants dans 
l'espace des nombres complexes sur le corps des nombres rationnels. 

3. Le groupe additif des nombres rationnels donné sur le corps des nombres 
réels sera-t-il un espace vectoriel? Si c'est non, dire pourquoi en est-il ainsi. 
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$ 18. Espaces vectoriels des segments orientés 


Nous avons déjà dit que les ensembles des segments orientés 
colinéaires, des segments orientés coplanaires et de tous les segments 
orientés de l’espace forment des espaces vectoriels sur le corps des 
nombres réels. Notre tâche immédiate est de trouver leurs dimen- 
sions et de construire leurs bases. 

Lemme 18.1. Une condition nécessaire et suffisante de la dé- 
pendance linéaire de deux vecteurs est leur colinéarité. 

Démonstration. Remarquons que l’assertion du lemme 
est évidente si au moins l’un des deux vecteurs est nul. Nous allons 
donc supposer que les deux vecteurs soient non nuls. 

Soient a et b des vecteurs linéairement dépendants. Il existe alors 
des nombres a et f tels que 


aa + Bb = 0. 
Puisque par hypothèse a Æ 0, bÆ 0, on aax<0, 0, donc 


=(-5)e 


Par conséquent, d’après la définition de la multiplication d’un seg- 
ment orienté par un nombre, les vecteurs a et b sont colinéaires. 

Supposons à présent que deux vecteurs a et b soient colinéaires. 
Appliquons-les à un même point O. Ces vecteurs sont portés par une 
droite que nous transformerons en axe en lui affectant un sens de 
parcours. Les vecteurs a et b sont non nuls, il existe donc un nombre 
réel À tel que la mesure algébrique du segment orienté a est égale au 
produit de la mesure algébrique du segment orienté b par le nombre 
À, c'est-à-dire {a} = À {b}. Mais d’après la définition de la multipli- 
cation d’un segment orienté par un nombre, cela signifie que a = 
— }b. Ainsi, les vecteurs a et b sont linéairement dépendants. 

Le lemme démontré entraîne que l'espace vectoriel des segments 
orientés colinéaires est un espace à une dimension, un vecteur non 
nul quelconque lui servant de base. 

Du lemme 18.1 on peut tirer un corollaire utile: si deux vecteurs 
a et b sont colinéaires et a Æ 0, il existe un nombre À tel que b — 
— }a. En effet, ces vecteurs sont linéairement dépendants, c’est-à- 
dire pour certains nombres a, B non simultanément nuls, aa + Pb — 
— 0. Si l'on suppose que B = 0, il en résulte que «a = 0. Par suite, 
B -£ 0 et on peut prendre À = (—a)/$. 

Lemme 18.2. Pour que trois vecteurs soient linéairement dépen- 
dants, il faut et il suffit qu'ils soient coplanaires. 

Démonstration. Sans limiter la généralité, supposons 
qu'aucun couple de trois vecteurs en question ne soit colinéaire, 
sinon le lemme est immédiat d’après 18.1. 
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Ainsi, soient a, b, c trois vecteurs linéairement dépendants. Il 
s'ensuit qu'il existe trois nombres a, B, y non tous nuls tels que 


aa + Bb + yce = 0. 
Si, par exemple, y = 0, cette équation donne 


œ p 
c=(—+) a+(—+) " 

Appliquons les vecteurs a, b, c à un même point ©. La dernière 
égalité entraîne que le vecteur c est égal à la diagonale du parallé- 
logramme ayant pour côtés les 
vecteurs (—a/y) a et (—$/y) b. 5 C 
Cela signifie qu'après la trans- 
lation au même point les vec- 
teurs a, b, c appartiennent au 
même plan et, par suite, sont À 
c planaires. 

Supposons maintenant que les 
vecteurs a, b,c soient coplanai- 


res. Rapportons-les sur un plan Ÿ a Cl 
et appliquons-les à un même 
point © (fig. 18.1.). Menons par Fig. . 18.1. 


l'origine et l'extrémité du vec- 
teur c les droites parallèles aux vecteurs a et b et examinons le pa- 


rallélogramme OACB. Les vecteurs a, OA et b, OB sont colinéaires 
par constmnction et non nuls; il existe donc des nombres À, p tels- 
que 


OA=ja, OB=. 
Mais OC = OA + OB, donc ce = a + ub, ou bien 
Aa + pb + (—1) c = 0. 


Les nombres À, u, —1 étant non nuls, cette dernière égalité traduit. 
la dépendance linéaire des vecteurs @, b, c. 

Maintenant nous pouvons répondre à la question sur la dimen- 
sion de l’espace vectoriel des segments orientés coplanaires. D’après. 
le lemme qui vient d’être démontré, la dimension de cet espace est 
inférieure à trois. Mais deux segments orientés non colinéaires de 
cet espace sont linéairement indépendants. Il s'ensuit que l’espace- 
vectoriel des segments orientés coplanaires est un espace à deux di- 
mensions qui a pour base n'importe quels deux vecteurs colinéaires. 

Lemme 18.3. Quels que soient quatre vecteurs, ils sont linéai- 
rement dépendants. 

Démonstration. Supposons sans limiter la généralité: 
qu'aucun triplet des quatre vecteurs quelconques ne soit coplanaire, 
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sinon le lemme est immédiat d’après 18.2. Appliquons les vecteurs 
a, b, c, d à l'origine commune © et menons par l’extrémité D du 
vecteur d les plans parallèles aux plans définis par les couples des 
vecteurs b, c; a, cet a, b (fig. 18.2). La règle du parallélogramme de 
l’addition des vecteurs entraîne 


OD=—0C+0E, OE—OA+OB, 
donc, 
OD=0A +0B+0OC. (18.1) 


Les vecteurs a, OA, ainsi que b, OB et c, OC sont colinéaires par 
Construction; en outre les vecteurs a, b, c sont non nuls. Il existe 
donc des nombres À, u, v tels que 


OA=ha, OB— nb, OC = xc. 
Compte tenu de (18.1) cela donne la relation 
d = }a + pb + ve, 


d'où l’on tire la dépendance linéaire des vecteurs a, b, c, d. 
Le lemme démontré permet de conclure que la dimension de 
l'espace vectoriel de tous les segments orientés est inférieure à qua- 
D tre. Mais cette dimension ne peut pas 
être inférieure à trois du fait que d'après 
PA À 18.2 trois segments orientés non copla- 
(4 naires quelconques sont linéairement in- 
dépendants. Il s'ensuit que l’espace vec- 
toriel de tous les segments orientés est 
un espace à trois dimensions qui a pour 


base n'importe quels trois vecteurs non 
coplanaires. 


d E Les espaces vectoriels examinés ne 
FA sont pas très suggestifs du point de vue 

LP géométrique, puisqu'ils admettent l’exis- 

0 a Â tence d’un nombre infini de vecteurs 
Fig. 18.2. égaux. Îls deviendront bien plus sugges- 


tifs si on fixe un représentant de chaque 
classe de vecteurs égaux et si on entend par « vecteur » un segment 
orienté tiré de l’ensemble de ces représentants. 

L'une des méthodes les plus commodes à cet effet est de considé- 
rer des ensembles des segments orientés appliqués à un même point 
0. Alors, au lieu de l’espace vectoriel des segments orientés coli- 
néaires, on obtient l’espace des segments orientés fixés en © et por- 
tés par une droite qui passe par ce point; au lieu de l’espace des 
segments orientés coplanaires, on a l’espace des segments orientés 
fixés en © et contenus dans un plan passant par ce point ; et enfin, 
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au lieu de l’espace vectoriel de tous les segments orientés, on a l’es- 
pace des segments orientés fixés en ©. 

Dans ce qui suit nous nous occuperons surtout des vecteurs fixés. 
Pour les espaces vectoriels correspondants introduisons les nota- 
tions Vi, Ve, Va, où l'indice inférieur indique la dimension. L’espa- 
ce vectoriel constitué seulement du segment orienté nul est noté V.. 

L'introduction de ces espaces permet d'établir une correspon- 
dance biunivoque entre les points et les segments orientés. À cet 
effet il suffit de faire correspondre à chaque vecteur son extrémité. 
C'est en vue d'une telle interprétation géométrique que nous dirons 
parfois pour les éléments non pas vecteurs mais points. 


Exercices. Quel est dans les espaces V1, V,, V, le sens géométrique des 
notions telles que: 


Enveloppe linéaire. 

Dépendance et indépendance linéaires. 

Systèmes équivalents de vecteurs. 

Transformations équivalentes élémentaires d'un système de vecteurs. 
Rang d'un système de vecteurs. 


now 


$ 19. Somme et intersection des sous-espaces 


L'étude des enveloppes linéaires a montré que tout espace vecto- 
riel contient un nombre infini d'autres espaces vectoriels. L’inté- 
rêt de ces espaces n'est pas limité par les questions examinées plus 
haut. 

Pour donner une enveloppe linéaire nous avons décrit directe- 
ment sa structure. On pourrait choisir une autre voie pour définir 
les espaces qui font partie de l’espace vectoriel donné par les pro- 
priétés de leurs vecteurs. Soit L un ensemble des vecteurs dans un 
espace vectoriel Æ. Si, pour les mêmes opérations que dans l’espace 
K, l'ensemble L est lui-même un espace vectoriel, nous l’appelons 
sous-espace en insistant sur le fait qu’un sous-espace est composé de 
vecteurs de l’espace X. Il est évident que le plus petit sous-espace 
est le sous-espace constitué par le seul vecteur nul. Nous l’appelons 
sous-space nul et le notons 0. Le plus grand sous-espace est l’espace 
K. Ces deux sous-espaces sont dits triviaur, tous les autres étant non 
triviaux. Il est clair que tout sous-espace, avec chaque couple de ses 
éléments x, y, contient toutes leurs combinaisons linéaires ax + By. 
La réciproque est également vraie. Plus précisément : 

Si un ensemble Z des vecteurs d’un espace vectoriel XÀ contient, 
avec chaque couple de ses éléments zx, y, toutes leurs combinaisons 
linéaires az + By, alors c'est un sous-espace. 

En effet, de tous les axiomes de l’espace vectoriel il faut véri- 
fier seulement ceux sur le vecteur nul et les vecteurs opposés, les 
autres axiomes étant évidents. Prenons a = 0, B = 0. Les corollai- 
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res des propriétés des opérations dans l’espace X font conclure que 
O-x + O:y = 0, c'est-à-dire le vecteur nul appartient à l’ensemble 
L. Prenons maintenant a — —1, B — 0. On a (—1) x + 0-y — 
— (—1)zx, c'est pourquoi, avec chaque vecteur zx, L contient égale- 
ment son vecteur opposé. Ainsi, l’ensemble ZL est un sous-es- 
pace. 

L'existence d’une base permet de dire que tout sous-espace d’un 
espace de dimension finie est une enveloppe linéaire. Il en résulte 
que, dans les espaces vectoriels de dimension finie, c'est une enve- 
loppe linéaire qui est le mode le plus général pour donner un sous- 
espace vectoriel. Dans un espace de dimension infinie il n’en est 
pas de même. Il ne faut pas oublier pour autant, que les notions et 
les faits relatifs aux espaces de dimension finie et à ceux de dimen- 
sion infinie ont de nombreux traits communs. Pour insister sur ce 
fait nous emploierons plus souvent, même pour des espaces à di- 
mension finie, le terme sous-espace vectoriel que le terme enveloppe 
linéaire. 

Soit À un espace de dimension nr. De même que pour l’espace X 
lui-même, on peut construire une base pour n'importe quel de ses 
sous-espaces ZL. Si dans l’espace À on a une base e,, e:, . . ., e,, 
alors, dans le cas général, les vecteurs de base du sous-espace Z ne 
peuvent être choisis directement parmi les vecteurs e:, e:, . . ., eh, 
ne serait-Ce que pour cette raison qu’il se peut qu'aucun d'eux ne 
fasse partie de Z. Toutefois, dans un certain sens, la réciproque est 
également vraie: 

Lemme 19.1. Si dans un sous-espace L de dimension s d’un 
espace K de dimension n on choisit une base arbitraire t1, . .., t,, il 
est alors possible de choisir dans K des vecteurs t,}1, . . ., t, tels que 
le système de vecteurs ta, . .., ts, lors - . ., th Soit une base pour; K 
tout entier. 

Démonstration. Examinons seulement ceux des systèmes 
linéairement indépendants de Æ qui contiennent les vecteurs #4, . .. 

., ts Il est clair qu’il y a parmi eux un système £,, ..., tt, 
Lotas + - - tp au nombre maximal de vecteurs. Mais alors, quel que 
soit le vecteur x de X, le système #1, . .., t,, x est linéairement dé- 
pendant. Il s’ensuit que le vecteur x doit s'exprimer linéairement 
par les vecteurs f1, . . ., 4,. Cela signifie que les vecteurs f1, . . 
sas - - «+, t forment une base de X et que p = n. 

Revenons à l’espace vectoriel X arbitraire. Il engendre l’ensem- 
ble de tous ses sous-espaces que nous noterons U. Sur ce dernier on 
peut définir deux opérations algébriques qui à partir de certains sous- 
espaces permettent de construire d’autres sous-espaces. 

On appelle somme L;, + L, de deux sous-espaces vectoriels Li, Lo, 
l’ensemble des vecteurs de la forme z = x + y où zx € La, y E La. 

On appelle intersection Li f] L: des sous-espaces vectoriels Li, La 
l’ensemble des vecteurs qui appartiennent à L, ainsi qu'à Le. 


+» Las 
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Notons que la somme et l'intersection des sous-espaces sont tou- 
jours des ensembles non vides, car ils contiennent bien le vecteur 
nul de l’espace À. Montrons que ces ensembles sont des sous-espaces. 

En effet, soient z,, z. deux vecteurs quelconques de la somme 
L; + La. Cela signifie que 21 — Zi + Ur Zs —= Le + VET où Lys La € 
€ L, et yy, Ya E L.. Considérons maintenant une combinaison linéaire 
arbitraire az, + Pz:. On a az: + fPza = à (x1 + x2) + BP (Ya + Yo). 
Etant donné que x1 + za € Li et ya + y2 € La, on a az1 + Bz: € 
€ L, + La Par conséquent, L. + L, est un sous-espace. Soit, main- 
tenant 21, Ze € Li N La, c'est-à-dire que 212: € Li et 21, 22 € La. I] 
est clair que az: + Bz. € L1 et az, + Pz: € L:, c'est-à-dire que 
az + Bza € Li N L:. On en tire que L: MN L: est également un 
sous-espace. 

Ainsi, l’addition des sous-espaces et leur intersection sont des 
opérations algébriques. Ces opérations sont évidemment commutatives 
et associatives. De plus, pour tout sous-espace L de K, 


L+0=Z, LfN KX = L. 


Les deux opérations ne sont liées par aucune loi distributive. 

Des exemples bien simples montrent que la dimension de la som- 
me de deux sous-espaces quelconques ne dépend pas seulement de la 
dimension des sous-espaces eux-mêmes, mais encore de celle de leur 
partie commune. On vérifie le 

Théorème 19.1. Quels que soient deux sous-espaces de dimen- 
sion finie L:, LA ils donnent lieu à l'égalité 


dim (Li N La) + dim (Li + L:)= dim Li+dimLs. (19.1) 


Démonstration. Désignons les dimensions des sous-espa- 
ces Lay, La, Li f] La par rx, ra, M respectivement. Choisissons dans 
l'intersection L, f\ L: n'importe quelle base c,, ..., cm. Ces vec- 
teurs sont linéairement indépendants et appartiennent à L. D’après 
le lemme 19.1, il existe dans L. des vecteurs a;, . . ., ax tels que le 
système ay, . - «+ ny Ci + + > Cm SOit une base dans L;. D'une façon 
analogue, dans le sous-espace L, il existe des vecteurs b1, ba, . .., Dh 
tels que le système b,,..., b}, C1, . - ., Cm Soit une base dans L:. 
De plus, 


n=k<+m,r:s = p+m. 
Si nous démontrons que le système des vecteurs 
dires ot dh, Cie 2 Can 0 >2 0) (19.2) 
est une base du sous-espace L, + La, le théorème a bien lieu, puisque 
m+(k+m+p)=(k+m)+(p+m). 


Tout vecteur des sous-espaces L:, L: s'exprime linéairement par 
les vecteurs de la base correspondante, et d'autant plus, par les 
vecteurs (19.2). C’est pourquoi tout vecteur de la somme L: + L: 
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s'exprimera également par ces vecteurs. Il nous reste à montrer que 
l'ensemble (19.2) est linéairement indépendant. Soit 


Qt +... + Gntn + Vaca +. + + + YmCm + Bibi + 
+... +Bnb) = 0. (19.3) 
Introduisons la notation 
b = Bad + . . - + Br». (19.4) 
Il est clair que b € L:. Mais (19.3) entraîne que b € L:1. Par suite, 
b € La ( L:, c'est-à-dire 
= ViCy + ee. + VmCm (19.5) 


pour certains nombres v1, . .., Vm. En comparant (19.4) et (19.5), 
on obtient 


Badi +... + Bpôp + (Vi) Ga +... + (—Vm) Cm = 0. 


Le système de vecteurs b:, . .., D, C1, . . ., Cm est linéairement 
indépendant par construction, donc 


Ba=... ===... =vn =0. 
Le système de vecteurs ay, . . ., Ah C15 + + :» Cm étant linéairement 
indépendant, on tire à présent de (19.3) que 

UM... = = Yi... = Ÿm = 0. 


Le théorème est démontré. 


Exercices 


1. Donner pour l'espace vectoriel V, l'interprétation géométrique de la 
somme et de l'intersection des sous-espaces. 

2. La somme des sous-espaces V, et V, que représente-t-elle ? 

3. L’intersection des sous-espaces V, et V, que représente-t-elle ? 

4. Montrer que la dimension de l'intersection d’un nombre quelconque de 
sous-espaces ne dépasse pas la dimension minimale de ces derniers. 

5. Montrer que Ja dimension de la somme d’un nombre quelconque des 
sous-espaces est au moins égale à la dimension maximale de ces derniers. 


$ 20. Somme directe des sous-espaces 


Soient L:, Lo, - . ., Ln des sous-espaces d'un espace vectoriel. 
D'après la définition de l'addition, tout vecteur x appartenant à la 
somme 

K=Li+Lls+...+Lh (20.1) 


peut être mis sous la forme 


Z=Tikrzo+...+zm (20.2) 
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où z; E L; pour tout i. En général, cette représentation n'est pas 
unique. Mais si chaque vecteur de À admet une représentation (20.2) 
unique, la somme (20.1) s'appelle somme directe et on la note 


K=L LL... (20.3) 


Les sommes directes jouissent de plusieurs propriétés spéciales. 
Quant à nous, ce n’est pas tant à ces propriétés que nous nous inté- 
resserons, mais plutôt à des traits communs à la décomposition par 
rapport à une base et à la décomposition (20.2). Supposons qu’un es- 
pace À puisse être décomposé en une somme directe (20.3) de ses 
sous-espaces Li, Le, . . ., LA. Alors, en vertu de l’unicité de la 
décomposition (20.2), le système des sous-espaces L;, L,, ..., Lh 
peut être considéré comme « base généralisée » de Æ, alors que la 
décomposition (20.2), comme décomposition par rapport à une « base 
généralisée ». Une telle interprétation de la somme directe est utile 
surtout pour l’étude des espaces vectoriels de grandes dimensions, du 
fait que dans leur cas on a d'habitude à étudier non pas toutes les 
composantes de la décomposition par rapport à une base, mais seu- 
lement un petit nombre d’entre elles. Le recours à la somme directe 
permet d'éviter tant les décompositions trop longues que des détails 
inutiles. 

Soit X un espace vectoriel de dimension #7. Prenons l’une quel- 
conque de ses bases e1,. €:, . . ., e, et construisons des enveloppes 
linéaires Li — Li(e;), Le = Le(e:), . . ., Lh = L, (e,). 11 devient 
alors clair que À est la somme directe de ces nr sous-espaces à une 
dimension. Il existe d’autres moyens pour mettre l’espace X sous 
la forme d’une somme directe de sous-espaces. Une telle représen- 
tation s'’appuye sur le 

Théorème 20.1. Pour qu'un espace K soit somme directe de 
ses sous-espaces Li, . . ., L, il faut et il suffit que la réunion des bases 
de ces sous-espaces constitue une base de l'espace tout entier. 

Démonstration. Soient À la somme directe des sous- 
espaces La, . . ., Let les vecteurs e;, . .., Esp ee 3 Ca gti 

+ Es des bases respectives de ces sous-espaces. Alors pour tout 


vecteur x de Æ a lieu la décomposition (20.2). En mettant chaque 
vecteur zx; sous la forme de décomposition par rapport à la base du 
sous-espace ZL, correspondant, on obtient 


T= de +... +asent ... + Lan ttemutt Test Gas, (20.4) 


pour certains nombres a, . .., as 


Ainsi, chaque vecteur de X peut ‘être représenté sous la forme 
d’une combinaison linéaire des vecteurs e1, ..., e, . Pour dire 


que ces vecteurs constituent une base de À, il reste prouver leur 
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indépendance linéaire. Considérons l'égalité 
Pie: +... + Puess + + Ban +18 ti T'es +iies, = 0 (20.5) 
à coefficients numériques fr, ..., B,, et introduisons la notation 


Baies +... + Pots = Vis 
D nd ed re (20.6) 
Pan i+188n tt +... + Pas, = Ym- 
Il est évident que y, € L;, et que (20.5) entraîne l'égalité 
O=yi+... + Yme 
Tous les sous-espaces contiennent le vecteur nul; on vérifie donc 
la relation 
0=0+...+0. 
La décomposition du vecteur nul de X suivant les sous-espaces 
Li, - - > Lm étant unique, on voit que 
Yi =... = Ym = 0. 


Il en résulte l'annulation de tous les coefficients des combinaisons 
linéaires (20.6), c'est-à-dire l'indépendance linéaire des vecteurs 
Eir + + Es. 
Supposons maintenant que lesl vecteurs ex, ..., CPAS 
5 Es gris + + 68 qui constituent des bases respectives des sous- 
espaces Li, . . ., L forment une base de Æ. Alors, pour tout vec- 


teur x de KÆ a lieu la décomposition unique (20.4). En introduisant les 
notations 


Qi + - + + Us, = Lis 
Moi iii be oi Gien (20.7) 


Lan uit sm ti +... + Les = Tm 


on obtient qu'il existe pour x au moins une décomposition (20.2). 
Chaque vecteur zx; de (20.7) est une combinaison linéaire des vec- 
teurs de la base ide ZL,. En vertu de l'unicité de la décomposition 
(20.4), on constate pour ce vecteur que sa décomposition (20.2) 
est également unique. Le théorème est démontré. 


Exercices 


4. Dans quelles conditions l'espace V, sera la somme directe de ses sous- 
espaces V, et V,? 


2. Dans quelles conditions l'espace V, sera la somme directe de deux de 
ses sous-espaces V,? 


3. L'espace V, peut-il être la somme directe de ses deux sous-espaces V,? 


$ 21. ISOMORPHISME DES ESPACES VECTORIELS 65 


Si c'est non, dire pourquoi en est-il ainsi. 

4. Montrer que pour que la somme (20.1) soit directe, il faut et il suffit 
que la décomposition (20.2) soit unique pour le vecteur nul. 

5. Montrer que pour que la somme (20.1) soit directe, il faut et il suffit 
que l'intersection de chacun des sous-espaces L;, i —1, . .., m, avecla somme 
es autres sous-espaces ne contienne que le vecteur nul. 


$ 21. Isomorphisme des espaces vectoriels 


Considérons l’ensemble de tous les espaces vectoriels donnés 
sur le mème corps P. Il est naturel de se demander en quoi ces espa- 
ces se ressemblent-ils et quelle est la différence entre eux? 

La description de chaque espace vectoriel compte deux parties 
bien distinctes. Un espace vectoriel est en premier lieu un ensemble 
des objets concrets appelés vecteurs. En second lieu, sur ces objets 
concrets on définit les opérations d’addition et de multiplication par 
un nombre qui jouissent de certaines propriétés. Aussi, peut-on 
envisager soit la nature des vecteurs et leurs propriétés, soit les 
propriétés des opérations indépendamment de la nature des éléments. 

Nous nous sommes intéressés à la nature des vecteurs seulement 
pour étudier les segments orientés, et encore dans la mesure néces- 
saire pour introduire les opérations et établir leurs propriétés. Après 
cela, l'examen des segments orientés s’appuyait uniquement sur les 
propriétés des opérations. Dans tout autre cas concret nous procé- 
derons d'une manière analogue. Pour cette raison nous considé- 
rerons que deux espaces identiques par rapport à l'addition et à 
la multiplication par un nombre possèdent les mêmes propriétés 
ou sont isomorphes. Plus précisément : 

Deux espaces vectoriels donnés sur le même corps sont dits isomorphes 
si on peut établir entre leurs vecteurs une correspondance biunivoque 
telle qu'à la somme de tout couple de vecteurs du premier espace cor- 
respond la somme des vecteurs respectifs du deuxième espace, alors qu'au 
produit d'un nombre par un vecteur du premier espace correspond le 
produit de ce même nombre par le vecteur correspondant du deuxième 
espace. 

Soient À et X” des espaces isomorphes. Le fait qu'à chaque vec- 
teur x de Æ on associe un vecteur bien déterminé x’ de Æ° peut être 
envisagé comme définition d'une « fonction » 


z' = o (x), (21.1) 


ayant pour « variable indépendante » le vecteur x de l'espace X, 
et pour valeur, le vecteur z” de l’espace K”. A présent, les deux 
propriétés de cette fonction peuvent s’écrire de la façon suivante. 
Pour x, y quelconques de Æ et pour tout À 


© (z+y)=0 (z) +0 (y), | 


o (Az) = Aw (zx). 22) 


5—01090 
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La correspondance biunivoque entre Æ et K” traduit le fait qu’à 
des valeurs différentes de la variable indépendante correspondent les 
valeurs différentes de la fonction (21.1), c’est-à-dire si 


ZÆY, (21.3) 
il vient 


o (x)  w (y). (21.4) 


Par conséquent, l'égalité ou l'inégalité des valeurs de la fonction en- 
traînent respectivement l’égalité ou l’inégalité des valeurs de sa va- 
riable indépendante. 

Les espaces isomorphes ont de nombreux traits communs. En 
particulier, au vecteur nul correspond un vecteur nul du fait que 


© (0) = © (0-x) = O-w (x) = 0-7” = 0”. 


Pourtant, la propriété d'importance majeure est qu’à un système 
de vecteurs linéairement indépendant correspond un système linéai- 
rement indépendant. 

En effet, soient n vecteurs Z1, Ze, - - ., Zn linéairement indé- 
pendants. Examinons la combinaison linéaire a1w (z1) + 20 (x2) + 
+... + a, (r,) et égalisons-la à zéro. En vertu des propriétés 
de l’isomorphisme, on a 


0" = ao (t1) + G20 (72) +... + ao (mn) = 


0 (@1Z1 + Cale +... + QnTn) — (0), 
d’où 


ŒTr + Gate +... + az, = (. 


Les vecteurs 21, z2:, . . ., z, étant linéairement indépendants, tous 
les coefficients doivent être nuls. 

La propriété démontrée permet d'affirmer que si deux espaces 
vectoriels de dimension finie sont isomorphes, ils ont la même di- 
mension. La réciproque est également vraie: 

Théorème 21.1. Deux espaces vectoriels de dimension finie 
ayant la même dimension et donnés sur le même corps sont isomorphes. 

Démonstration. Soient X et K’ deux espaces vectoriels 
de dimension n. Choisissons une base e,, e:, . . ., e, dans Æ et une 
base e;, e,, ..., e, dans K”’. Elles nous serviront pour construire un 
isomorphisme « comme suit. Associons à chaque vecteur 


TZ = Qyéy + Unes +... + Ann 
de l’espace XÆ le vecteur 
& (x) = aœe, + ae; +... +anes 


de l’espace K”. La correspondance ainsi établie est biunivoque du 
fait que la décomposition par rapport à une base est unique. 
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Choisissons ensuite deux vecteurs quelconques zx et y de K et 
un nombre arbitraire À et supposons que 


TZ — Qué + Unes + . - . + ner» 


y — Be + Baez + eu pres: 
On a 


© (+ y) = 0 ((@s + Bi) € + (ao + Be) 62 +... + (an + Pr) en) = 
— (as + Bi) ei + (me + Bo) €, +... + (an +Br)en= 


= (ae, + &e, + ... + Œnen) + (Bies + Pre, +... + Bren) — 
= @ (x) + w (y), 
@ (Ar) = @ ((Aœ:) € + (Amz) 2 +... + (Am)en = 
—=(Aa)e,+ (Aa) e, + ...—+(Aa) en) — 
=} (ae +oei+ + ane) = A (2). 


Ces égalités fournissent la preuve du théorème. 

L'intérêt de ce théorème est considérable. C'est lui qui autorise 
de dire avec certitude que du point de vue des corollaires éventuels 
qu’on peut tirer des axiomes, il est impossible de distinguer deux 
espaces vectoriels de même dimension donnés sur le même corps. 
Par conséquent, on pourrait bien construire un seul espace vectoriel 
de dimension n sur le corps donné et en tirer toutes les propriétés 
des espaces de dimension finie sur ce corps. 

Soit un corps P. Considérons l’ensemble dont les éléments sont 


toutes les collections ordonnées de r nombres &y, G2, . .., &h du 
corps P. Si x est un élément de cet ensemble, nous noterons 
TZ = (a, Ua, ee.) ah) (21.5) 


Donnons la définition suivante de l’addition et de la multipli- 
cation par un nombre À du corps P: 


(as, 2, -..) Gn) + (Bs B2, ... Bn) = 


= (@; + Bi Oz + Bo, ess On +Pn); (21.6) 
À (@i, Œ, ..., An) = (As, À, ..., AG). 


Les axiomes d'un espace vectoriel se vérifient sans peine. En 
particulier, le vecteur nul est défini par la collection ne contenant 
que des zéros, c’est-à-dire 


0 = (0, 0, ..., O0), 
et le vecteur opposé au vecteur (21.5) s'écrit 


ar — (— 1 — 23 - -. — On). 
5% 
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C'est un espace de dimension » et il est facile d’indiquer tout de 
suite l’une de ses bases: 


e, = (1, 0, . , 0, 0), 
En = (0, 1, ce. 0, 0), (21 1) 
en =(0, 0, ..., O, 1) 


Etant donné qu'un élément (21.5) donne lieu à la décomposition 
Z= Aer Qsls -j . . . + Unêns 


les nombres &y, &z, . . -, &, sont dits coordonnées du vecteur x. 

L'espace décrit s'appelle espace arithmétique et on le note P, 
en soulignant ainsi sa relation avec le corps P. Si P est le corps des 
nombres complexes, réels ou rationnels, cet espace est noté res- 
pectivement C,, À, ou D. 

A présent il peut sembler qu'aucun besoin n'est d'étudier les 
espaces vectoriels arbitraires de dimension nr. En effet, nous savons 
que du point de vue de la définition axiomatique il est impossible 
de distinguer entre eux les espaces vectoriels isomorphes; on peut 
donc étudier, par exemple, le seul espace P,. Or, la discussion géné- 
rale permet de révéler des propriétés des espaces vectoriels d’une im- 
portance capitale, c’est-à-dire celles qui ne dépendent pas de bases 
ou, autrement dit, qui sont invariantes par rapport aux isomor- 
‘ phismes. 

Si on n'étudiait que les espaces P, on serait lié à une base con- 
crète et il ne serait pas toujours aisé alors de découvrir l’invariance de 
telles ou telles conclusions. 11 fâut prendre garde à ne pas rapporter 
aux propriétés générales des espaces vectoriels des propriétés spé- 
cifiques de l'espace P,. Il n'est pas toujours facile d’observer ces 
conditions, loin de là. 

À titre de conclusion attirons l'attention sur la circonstance 
suivante. Examinons par analogie avec P, l'espace P, dont les 
éléments sont des collections ordonnées infinies des nombres 
Gi» Ge - - . du corps P. Par analogie avec (21.5), introduisons 
pour l'élément zx de cet ensemble la notation 


ZT — (@1, Œzs - - .) 


et définissons lesopérations sur les éléments par analogie avec (21.6). 

L'espace P, est un espace de dimension infinie. Si l'on suppose 
que les espaces de dimension infinie soient isomorphes à l’espace P.., 
on comprend sans peine que les espaces de dimension infinie et 
ceux de dimension finie ont de nombreux traits communs. Il ne 
faut jamais perdre de vue cet exemple. ù 


$2)]. DÉPENDANCE LINEAIRE ET SYSTÈMES D'ÉQUATIONS 69 


Exercices 


4. Construire une correspondance isomorphe entre l’espace V, et l'espace 
des nombres réels sur le corps des nombres réels. 

2. Construire une correspondance isomorphe entre l’espace V. et l’espace 
des nombres complexes sur le corps des nombres réels. 

3. Montrer que dans les espaces isomorphes les ensembles équivalents 
des vecteurs correspondent à des ensembles équivalents. 

4. Montrer que dans les espaces isomorphes une intersection des sous-espaces 
correspond à l'intersection des sous-espaces respectifs. 

5. Montrer que dans les espaces isomorphes la somme directe des sous- 
espaces correspond à la somme directe des sous-espaces respectifs. 


$ 22. Dépendance linéaire 
et systèmes d’équations linéaires 


L'étude de nombreuses questions liées d’une manière ou d’une 
autre à la dépendance linéaire se ramène au problème suivant. 

Soient A1, @z, - : ., Am un Système de vecteurs et b un vecteur. 
On demande si le vecteur b est une combinaison linéaire des vec- 
teurs du système considéré et quels sont les coefficients de cette 
combinaison. 

Si le vecteur b est une combinaison linéaire des vecteurs a1, 


Gay + + + Em, il existe des nombres 21, Z2, . .., Zn tels que 
21d1 203 Es es se, = 0: (22.1) 
Par conséquent, le problème se ramène à la discussion de l’équa- 
tion vectorielle (21.1) par rapport aux nombres Z;, Ze, . - ., 2m: 
Supposons que les vecteurs soient donnés par leurs coordonnées 
relatives à une certaine base e,, e:, . .., ex, c'est-à-dire 


Ay— (Gus, os, -- -, An); 

Ao = (Qy, Œao, ..., Ah2); 

Im = (Am) om Axm)» 
b— (by, br, .., bn). 


En égalant les coordonnées correspondantes des vecteurs du premier 
et du second membres de l'équation (22.1), on obtient 


Gy1Z4 À 222 +... + Gimm = Di. 
G2f24 + A2222 + . . . + Gom2m = Va, (22.2) 


Gh424 + Gno2o +... + Gxm2m = Üx. Ù 

Ce système d'équations qui exprime en coordonnées l'équation 
(22.1) s'appelle système d'équations linéaires algébriques. Les nom- 
bres br, b2, . . ., b, sont appelés seconds membres et 21, 22, . . ., 2m 
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inconnues du système. Un ensemble ordonné des valeurs des incon- 
nues qui satisfait à chacune des équations (22.2) s'appelle solution 
du système. Si un système d'équations linéaires algébriques possède 
au moins une solution, il est dit compatible; dans le cas contraire, 
on dit qu'il est incompatible. 

Ainsi, pour dire si le vecteur b est une combinaison linéaire 
des vecteurs ay, Ga, : - «+» Am» il faut établir si le système (22.2) est 
compatible ou non. Si le système est compatible, alors n'importe la- 
quelle de ses solutions donne les coefficients de la décomposition du 
vecteur b suivant le système des vecteurs a, &:, . . ., Am. 

Deux systèmes d'équations linéaires algébriques aux mêmes 
inconnues sont dits équivalents si, ou bien chaque solution de l’un 
est une solution de l’autre, ou bien les deux systèmes sont incom- 
patibles. 

Une méthode générale de résolution d’un système peut être fon- 
dée sur les transformations successives du système initial (22.2) 
en un système équivalent dont la solution est assez simple à obtenir. 
Nous allons décrire l’une de telles méthodes appelée méthode d'éli- 
mination successive des inconnues ou méthode de Gauss. 

Dans le cas général, la résolution ne compte pas plus de 4 — 1 
étapes. Pour distinguer les étapes nous munissons les coefficients des 
inconnues et les seconds membres par un indice supérieur indiquant le 
numéro de l’étape réalisée. D'après cette convention le système 
initial (22.2) se met sous la forme 


0 0 
az + aN 22 +. + afnzm =), | 


0 0) 
Q$?z3 + a 92, +... L aEMzm = 0, 


(22.3) 


0 (0 0 (0 | 
AN 24 + Ghz + +. + Qmm = Ok « J 


Considérons la première équation. Si tous les coefficients des 
inconnues ainsi que le second membre y sont nuls, cette équation est 
vérifiée par toute collection des nombres 2, 22, . . ., zn- Par con- 
séquent, en éliminant la première équation, nous obtiendrons un 
système équivalent. Il se peut que tous les coefficients des inconnues 
de la première équation soient nuls, alors que le second membre ne 
le soit pas. Aucune des collections des nombres 21, Z2, . . . ., 2m ne 
peut vérifier une telle équation. Dans ce cas le système est incom- 
patible et sa discussion est ainsi terminée. 

Supposons donc que parmi les coefficients des inconnues de la 
première équation il y ait au moins un non nul. Sans restreindre la 
généralité on peut admettre que a = 0, parce que s'il n’en est pas 
ainsi, on peut l'obtenir en permutant les inconnues. Appelons l'élé- 
ment a” élément pivot. Résolvons la première équation par rapport 
à l’inconnue z,, puis portons l'expression obtenue de :, dans toutes 
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les équations sauf la première. Après la réduction des termes sem- 
blables, on obtient un nouveau système 


a\Pzi+ az +... +aMzn = D), | 
a$9 22 +... + a zm— DS"), 


(22.4) 


Les coefficients de ce . sont liés aux coefficients du système 
précédent par les relations 


a!) — (0) ço) ii 
= d;; — €i; (0) ? 
ai 


(0) 
(1) (0) C0) Gi1 
b; " —=b; b; au 


pour tous les ë, j. 

Les systèmes 6 2.3) et (22.4) sont équivalents. En effet, sup- 
posons que le système (22.3) soit compatible. Alors, toute sa solu- 
tion Zy, Ze, - - -, 2m transforme en identités toutes les équations du 
système (22.3). En reprenant le processus d'élimination avec ces 
identités, nous découvrons que ladite solution est également solution 
du systeme (22.4). Supposons ensuite qu’une solution du système 
(22.4) ne soit pas solution du système (22.3). Elle vérifie à l'avance 
la première des équations (22.3). Supposons donc qu'elle ne satisfasse 
pas à une équation quelconque de numéro i > 2. En reprenant le 
processus d'élimination, on déduit alors que la solution choisie ne 
satisfait pas à la i-ième équation du système (22.4). Mais ceci con- 
tredit l'hypothèse. Il est donc clair que si l’un des systèmes est 
incompatible, l’autre système le sera également. 

Nous n'avons décrit que la première étape de la transformation 
d'un système. Toutes les autres étapes sont réalisées de la même 
façon. La deuxième étape élimine l’inconnue z. de toutes les équa- 
tions sauf les deux premières, la troisième, l’inconnue z;, de toutes les 
équations sauf les trois premières, etc. Si les transformations ne nous 
font pas tomber sur une équation dans laquelle tous les coefficients 
des inconnues sont nuls, après À — 1 étapes nous aurons le système 


0 0 (0 0) 0 
az a ro … + ai D x i+af, htZre te + 0Îm 2m = 0), 


1 1 
a Dz2+...+a$ D ai, hein. +a$z sn à 


k—1 k-! 
ah 2x: ak TRiZai te t0fm 2m b$ . 
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équivalent au système (22.4). Mais si au cours des transformations 
nous tombons sur des équations vérifiées identiquement, alors le 
système (22.5) sera composé d’un plus petit nombre d'équations. 

Les inconnues Z2»+1, - - ., 2 Sont dites libres. Il est évident que 
quelles que soient les valeurs qu'on leur affecte on peut calculer 
successivement toutes les autres inconnues de (22.5) à partir de :;. 
Les coefficients ai7, a, ..., a{—1) par lesquels il faudra diviser, 
sont des éléments pivots des étapes correspondantes et c'est pourquoi 
ils sont tous non nuls. 

Ainsi, du point de vue théorique, l'étude de la dépendance liné- 
aire a été suffisante. Mais au sens pratique, elle peut conduire à de 
très graves difficultés. Examinons, par exemple, dans l’espace R, 
le système de vecteurs 


di = (1, — 2, 0,.. , 0, 0), 
As = (0, 14,—2,...,0 0), 
he li. | (22.6) 
di (0,0: 6,482) | 
ay=(—2"*-0,0, 0,...,0, 1): 


C'est un système linéairement dépendant puisque 
PNG 2 h-0Q, + .. + Diaz = 0. 


Remarquons que pour 4 > 40, on a 2-%-b << 10-12: c’est pour- 
quoi dans les calculs pratiques on voudrait naturellement négliger 
une valeur aussi petite de la coordonnée. D'autant plus qu’en géné- 
ral la donnée des nombres est approximative et contient presque 
toujours des erreurs bien plus grandes. Mais même si les coordon- 
nées étaient exactes, les premières opérations sur ces coordonnées, 
si les calculs sont approchés, conduisent à des résultats entachés 
d'erreurs. Il faut ajouter que la majorité des calculatrices modernes 
sont incapables de manipuler des nombres aussi petits que 2-*-1 
pour k >> 64 et les tiennent pour zéros. Il en résulte qu'au lieu d'un 
système de vecteurs (22.6) on peut avoir pratiquement affaire au 
système 

di —=(1,—2, 0, ..., 0. 0), 

a2=(0, 1,—2,...,0, OO), 

D D dre de .. (22.7) 
ap; =(0, 0, 0, ...,1,—72), 


ax=(0, 0, 0,...,0, 1). 
Mais ce système est linéairement indépendant. 


Ainsi, lorsque la donnée des coordonnées est approximative et 
les opérations sur ces coordonnées sont approchées, de petits change- 
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ments dans les coordonnées des vecteurs peuvent rendre indépendant 
un système linéairement dépendant et inversement. Mais on se 
demande alors, naturellement, quelle importance pratique peu- 
vent avoir les notions telles que dépendance linéaire, rang, base, 
systèmes compatibles et incompatibles, et en général, tout ce que 
nous avons étudié jusqu'ici ? Il est impossible de donner à cette ques- 
tion une réponse simple parce que cette question est liée à une intel- 
ligence profonde des problèmes à résoudre. C’est la question qui est à 
l'origine de la différence entre les mathématiques « exactes » et les mathé- 
matiques « approchées ». 


Exercices 


1. Montrer que si le système (22.2) est compatible, il possède une solution 
unique si et seulement si le système de vecteurs a, a, . .., a, est linéaire- 
ment indépendant. 

2. Montrer que si le rang du système de vecteurs a,, a, ..., a, est r, 
le système (22.5) se compose de r équations. 

3. Considérons les solutions du système (22.2) comme vecteurs de l’es- 
pace P,,. Soient b = 0 et l'ensemble des vecteurs a, a, ..., a&, de rang r. 
Montrer que dans ce cas l’ensemble des solutions du système forme un sous- 
espace de dimension (m — r) de l’espace P,.. 

4. Trouver toutes les solutions du système 


V?zutizm=V3 | 
2.4+V22=V6. 


Résoudre ce même système en donnant V/2, V/3, V/6 avec une précision dif- 
férente. Comparer les résultats obtenus. 

5. Etablir la relation entre la méthode de Gauss et les transformations 
élémentaires d’un système de vecteurs. 


CHAPITRE 3 


MESURES DANS UN ESPACE VECTORIEL 


$ 23. Coordonnées affines 


Le nombre énorme de problèmes scientifiques et techniques im- 
pose une description exacte de la position dans l’espace des objets 
géométriques tels que points, figures, lignes, surfaces, etc. De plus, 
lorsqu'un objet est complexe, il est très important de connaître non 
seulement la caractéristique générale de sa position, per exemple son 
barycentre, mais encore la position de chaque point de l’objet. 

Rappelons à titre d'exemple que la prédiction des éclipses solai- 
res et lunaires n'est possible que grâce à la connaissance à tout ins- 
tant de la position des corps célestes. La télévision à grande distance 
n’est possible que parce que la position de chaque point de l’image 
transmise est bien repérée. 

Il suffit évidemment d’avoir un moyen pour décrire la position 
d’un seul point, puisque tout objet géométrique peut être donné 
comme une certaine collection de points. On aurait peut être raison 
‘d'examiner indépendamment la position d’un point sur une droite, 
sur un plan ou dans l’espace, parce que la description spatiale d’un 
objet ne présente pas toujours un avantage et de loin. Par exemple, 
une photographie peut bien être examinée sur un plan, et le mou- 
vement d’un point matériel en l'absence de l’action des forces sur 
une ligne droite. 

L'une des descriptions les plus usitées de la position d’un point 
est basée sur une idée bien simple. Nous avons déjà dit qu’on peut 
établir une correspondance biunivoque entre tous les points et tous 
les segments orientés liés. Il s’ensuit que la description de la posi- 
tion d’un point peut être remplacée par celle du segment orienté 
correspondant. Or, la position de ce segment est complètement dé- 
finie par ses coordonnées dans une base quelconque, c’est-à-dire 
par une collection ordonnée de nombres. Donc, la position du point 
sera également définie par cette collection de nombres. Nous pas- 
sons donc à la réalisation de cette idée. 

Soit une ligne droite. Fixons sur cette droite un point arbitraire O 
et examinons l’espace vectoriel V, des vecteurs portés par cette droite 
et fixés au point O. Choisissons dans cet espace un vecteur de base 
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quelconque a. Transformons maintenant la droite en un axe en lui af- 
fectant une orientation telle que la mesure algébrique du segment a 
soit positive (fig. 23.1). 

L'axe, le point O et le vecteur de base a donnés sur cet axe for- 
ment un système de coordonnées affine sur une droite. Le point O s’ap- 
pelle origine des coordonnées. 

La position de tout point M sur la droite est bien définie par le 
vecteur OM. Les vecteurs a et OM sont colinéaires et a = 0; c'est 
pourquoi, d’après le corollaire du lemme 18.1, il existe un nombre 
réel a tel que 


OM = aa. (23.1) 


Ce nombre est dit coordonnée affine du point M sur la droite. Le fait 
que « est la coordonnée de M se note M (a). 

Remarquons que, un système de coordonnées affine étant fixé 
sur une droite, la relation (23.1) définit d’une façon univoque la 
coordonnée affine & de n'im- 
porte quel point M de cette 4 à 
droite. La réciproque est éga- V1 a M 
lement évidente. Plus pré- 
cisément, chaque nombre « Fig. 23.1. 
définit d’une façon univoque 
par la relation (23.1) un point M de la droite. Ainsi, un système 
de coordonnées affine fixe réalise une correspondance biunivoque 
entre tous les nombres réels et les points d’une droite. 

La donnée des points par leurs coordonnées permet de calculer 
les mesures algébriques des segmentslorientés et les distances entre les 
points. Soient deux points M;(aœ1) et M:(a2)- On a 


{MM} = {OM —OM;}= {aa — aa} — 
—={(a—a)a}—(a—aœ){a}=(a—œ)lal. (23.2) 
Si on désigne par p (M;, M2) la distance entre M, et M, il vient 
PM, M2)=|{MiM:}|=|le-ællal. (25.3) 
Les formules deviennent particulièrement simples si la longueur du 
vecteur de base est égale à l’unité. Dans ce cas 
UM3M2}= @2— a, | 

P(Mi, M2)=|@— cl. 


Soit maintenant un plan. Fixons sur ce plan un point arbitraire O 
et considérons l’espace V, des vecteurs contenus dans ce plan et fixés 
en ©. Choisissons dans cet espace un couple a, b quelconque des 


(23.4) 
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vecteurs de base. Donnons aux droites qui portent ces vecteurs une 
orientation de façon que les mesures algébriques des segments a, 
b soient positives (fig. 23.2). 

Deux axes sur un plan qui se coupent en O et qui portent les vec- 
teurs de base a, b donnés sur ces droites forment un système de coor- 
données affine sur un plan. L’axe auquel appartient le premier vec- 
teur de base s'appelle axe Oz ou axe des abscisses : le deuxième vec- 
teur de base appartient à l’axe 
Oy ou à l'axe des ordonnées. 

Cette fois encore la position 
de tout point M sur un plan est 
définie d'une façon univoque 
par le vecteur OM, et pour ce 
dernier, il existe à son tour une 
décomposition unique de la forme 


OM=aa+fb. (23.5) 


Les nombres réels a, B sont appe- 

lés là aussi coordonnées affines du 

Fig. 23.2. point M. La première coordonnée 

s'appelle abscisse, et la deuxième, 

ordonnée de M. Le fait que M possède les coordonnées a, f se note 

M (a, P). 

Les axes de coordonnées Oz, Oy contiennent des points uniques 

M,, M, tels que 


OM=0OMx;+O0My. (23.6) 

Ces points se trouvent aux intersections des axes avec les droites 

parallèles aux axes et passant par M. On les nomme projections 

affines du point M sur les axes des coordonnées. Les vecteurs OM, 

OM, s'appellent projections affines du vecteur OM. De l’unicité des 
décompositions (23.5), (23.6) on tire que 

OM:=aa, OM, =Bb. (23.7) 


Ainsi, lorsque les coordonnées du point sont M (a, B), les 
coordonnées des points M,, M, en tant que points d'un plan sont 
M, (a, 0), M, (0, B). En outre, si 

OM — (a, B), 
alors, 
OMz:=(a, 0), OM,=(0,B). 


Chaque vecteur de base détermine sur la droite qui le contient un 
système de coordonnées à lui. C’est pourquoi chacun des points M. 
M, peut être considéré aussi dans le système de coordonnées de la 
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droite correspondante. Toutefois, (23.7) entraine que la coordonnée 
du point M, sur l’axe Oz est égale à l’abscisse du point M. D'une 
façon analogue, la coordonnée du point M, sur l’axe Oy est égale à 
l'ordonnée du point M. Toutes évidentes qu'elles sont, ces affir- 
mations sont très importantes, car elles autorisent l'utilisation des 
formules (23.2) à (23.4). 

Un couple ordonné de nombres a, B définit univoquement un 
certain point. En effet, les relations (23.7) permettent de construire 
des projections affines bien défi- 
nies du point, qui également défi- 
nissent de façon univoque le point 
concerné du plan. Par conséquent, 
un système de coordonnées affine 
réalise une correspondance biuni- 
voque entre tous les couples ordonnés 
de nombres réels et les points du plan. 

On introduit d’une façon ana- 
logue le système de coordonnées 
affine de l’espace. Fixons un point 
O et examinons l’espace V, des 
vecteurs localisés en ©. Choisis- 
sons dans cet espace un triplet de 
vecteurs de base a, b, c. Orientons Fig. 23.3. 
les droites qui portent ces vec- 
teurs de façon que les mesures algébriques des segments a, b, c soient 
positives (fig. 23.3). 

Trois axes de l’espace concourants au même point © avec les 
vecteurs de base a, b, c forment un système de coordonnées affine 
dans l’espace. Le premier vecteur de base appartient à l’axe Oz ou 
à l’axe des abscisses, le deuxième, à l’axe Oy ou à l’axe des ordonnées 
et le troisième, à l’axe Oz ou à l’axe des cotes. Pris deux à deux les 
axes de coordonnées définissent ce qu’on appelle plans de coordonnées 
que nous allons noter Ozxy, Oyz et Ozxz. 

La position d’un point M quelconque de l’espace est cette fois 
encore bien définie par le vecteur OM qui possède une décomposition 
unique 


OM = aa + Bb + yc. 


Les nombres réels &, $, y s'appellent coordonnées affines du point M 
de l’espace. La première coordonnée est appelée abscisse, la deuxième, 
ordonnée et la troisième cote du point #. Le fait que les coordonnées 
de M sont «, B, y se note M (ax, B, y). 

Menons par un point M les plans parallèles aux plans de coor- 
données. Désignons par M;, M,, M; les points d'intersection de 
ces plans avec les axes de coordonnées Oz, Oy, Oz et nommons-les 


78 MESURES DANS UN ESPACE VECTORIEL (CH. 3 


projections affines du point M sur les axes de coordonnées. L'inter- 
section des plans de coordonnées avec les couples des plans passant 
par le point M détermine les points M, M, M,, que nous appel- 
lerons projections affines du point M sur les plans de coordonnées. 


Les vecteurs OM yz OM,, etc. s’appelleront respectivement projec- 
tions affines du vecteur OM. Il est évident que 


OM —O0M:+0M,+0M:, 
OM,;:=0M,+0M:, 
OM ::=0M:+0M:, 
OM xy =O0Mx+0My. 


De même que dans le cas d’un plan, tirons que si les coordonnées 


de M sont 
M (a, 6, Ÿ), 


les coordonnées des projections affines de ce point s’écrivent 


M;(a, 0,0), M,(0,B,0), M:,(0, 0, y), 
My:(0,B,%), Mac, 0,7), Mxy(a, B, 0). | [(23.8) 


D'une façon analogue, si 


OM =(a, B, v), 

.On à 

OM:=(a, 0,0), OM,=(0,8,0), OM:=(0, 0, y), 
OM:= (0, B, y). OM=— (œ, 0, v), OMy — (a, b, 0). 


Là encore chaque vecteur de base et chaque couple de vecteurs 
de base forment des systèmes affines sur les axes et les plans de coor- 
données. De nouveau, les coordonnées des points dans ces systèmes 
coïncident avec les coordonnées affines de ces mêmes points con- 
sidérés comme points de l’espace. A présent, le système de coordon- 
nées affine étant fixé, il réalise une correspondance biunivoque entre 
tous les triplets ordonnés des nombres réels et les points de l'espace. 

Parmi les systèmes de coordonnées affines sur la droite, le plan 
et l’espace, on recourt surtout aux coordonnées cartésiennes. Elles se 
distinguent par des vecteurs de base tous de même longueur égale 
à l’unité et par le fait que dans le cas du plan et de l’espace les axes 
sont deux à deux perpendiculaires. Dans un système cartésien, il 
est d'usage de noter les vecteurs de base à, j, k. Dans ce qui suit nous 
n'utiliserons généralement que ces systèmes. 
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Exercices 


1. Quelles sont les positions relatives de deux points À (a), B (—a) 
sur l’axe de coordonnées représenté sur la figure 23.1? 

2. Quel est le lieu géométrique des points M (&, B, y) dont la projection 
affine M,, ait la forme M,, (—3, 2, 0 ? 

3. Les coordonnées d’un point dépendent-elles de l'orientation des axes 
de coordonnées? 

Comment changent les coordonnées d'un point si l'on fait varier la 

longueur des vecteurs de base? 

5. Quelles sont les coordonnées du centre d’un parallélépipède si l’origine 
aes coordonnées se confond avec l’un de ses sommets, et les vecteurs de base, 
avec ses arêtes? ‘ 


$ 24. Autres systèmes de coordonnées 


Les systèmes de coordonnées utilisés en mathématiques permet- 
tent de donner à l’aide des nombres la position de n’importe quel 
point de l’espace, du plan ou de la droite. Ceci rend possible, en 
particulier, l’utilisation des calculatrices pour résoudre des pro- 
blèmes géométriques, étudier toutes 
sortes d’objets et de relations géo- 
métriques. Outre les coordonnées 
affines on utilise souvent d’autres 
systèmes. 

Coordonnées polaires. Choisis- 
sons sur un plan une droite et fixons 
sur cette droite un système de coor- 
données cartésien. L'origine O de ce 
système sera appelée pôle et l'axe 
de coordonnées, axe polaire. Ad- 
mettons ensuite que le segment Fig. 24.1. 
unité du système de coordonnées 
de la droite sert pour mesurer toutes les longueurs dans le plan. 
Examinons un point M du plan. Il est évident que sa position est 
parfaitement définie si l’on donne la distance p entre M et O et 
l'angle q formé par la demi-droite Oz et le segment OM et compté 
dans le sens inverse à celui des aiguilles d'une montre (fig. 24.1). 

On appelle coordonnées polaires du point M d’un plan deux nom- 
bres p et p. Le nombre p est appelé rayon polaire, le nombre , angle 
polaire. Comme ce dernier n’est pas défini d’une façon univoque, 
il est d'usage de se borner aux valeurs 


0 << p < + 00, 0< p< 2x. (24.1) 
Si le point M se confond avec le pôle O, on admet que l'angle 
polaire n'est pas défini. 


À chaque système de coordonnées polaires est associé naturelle- 
ment un système cartésien. Dans ce système, l’origine coïncide avec 
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le pôle, l’axe des abscisses avec l’axe polaire, et l’axe des ordonnées 
s'obtient par rotation de l’axe polaire autour du point O de l'an- 
gle x/2. 

Désignons les coordonnées cartésiennes Oxry du point M par «, f. 
On obtient alors les formules évidentes 


& = P COS P, B = p sin 9. 


D'où les relations inverses 


a p 
+(a2+82)"° Pete 


Ces formules permettent de calculer les coordonnées polaires à partir 
des coordonnées cartésiennes et inversement. 

Coordonnées cylindriques. Choisissons dans l’espace un plan x 
et fixons dans ce plan un système de coordonnées polaires. Menons 
par le pôle © l’axe Oz perpen- 
diculaire au plan x (fig. 24.2). 
Admettons encore que pour 
mesurer les longueurs dans 
l’espace on utilise le même 
segment unité. Introduisons 
dans le plan x le système de 
coordonnées cartésiennes asso- 
cié au système polaire. Il for- 
mera avec l'axe Oz un sys- 
tème de coordonnées cartésien- 
nes dans l’espace. 

Considérons les projections 
M; et M; d'un point M de 

Fig. 24.2. l’espace sur l'axe Oz et le 

plan Ozxry. Les coordonnées 

polaires du point Mf,, qui est un point du plan x sont p, @. La 
coordonnée du point M: qui appartient à l'axe Oz est z. 

On appelle coordonnées cylindriques du point M les trois nombres 
P, ®, z. On suppose encore que 


0<Pp< + ©, 0<p<2nr. 


p? = a? + f?, cos @ — 


Pour les points de l’axe Oz l'angle @ n’est pas défini. 
Les coordonnées cartésiennes Ozxyz sont liées aux coordonnées 
cylindriques par les égalités 


TT =DCOSP, y =Ppsinp, z=2Z 


Coordonnées sphériques. Considérons dans l’espace un système 


de coordonnées cartésiennes Üzxryz associé à un système de coordon- 
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nées polaires du plan Oxy (fig. 24.3). Soient M un point quelconque 
de l’espace distinct de O, M,, sa projection sur le plan Oxy. Notons p 
la distance entre M et O, 8 l’angle entre le vecteur OM et le vecteur 
de base de l’axe Oz et, enfin, 
p l'angle polaire de la projection 


xy° 
On appelle coordonnées sphéri- 
ques du point M les trois nombres 
p, p, 6. Le nombre pest le rayon, le 
nombre q la longitude, le nombre 8 
la latitude. De plus, on suppose 
que 


0<p< +00, 
0<p<2r, 0<6<7r 
La longitude n’est définie pour aucun Fig. 24.3. 
point de l'axe Oz, la latitude ne 
l'est pas pour le point ©. 


Les coordonnées cartésiennes Ozxzyz sont liées aux coordonnées 
sphériques par les égalités 


z = psin O0 cos, y = psin 0sinp, z—=pcos 0. 


Exercices 
1. Construire une ligne dont les coordonnées polaires des points vérifient 
la relation p = .ços 39. 


2. Construire une Aire dont : coordonnées cylindriques des points véri- 
fient les relations p = o-1, z 


Construire une lie out les coordonnées sphériques des points véri- 
fient les relations 


0Z<p<i, p= 172, 0< 0 < n/2. 


$ 25. Quelques applications 


Examinons quelques applications bien simples des coordonnées 
cartésiennes dans l’espace. Les problèmes analogues pour le plan 
n’en diffèrent que par quelques détails négligeables. Admettons 
partout que nous avons fixé un système de coordonnées d’origine © 
et de vecteurs de base à, j, k. 

Coordonnées d’un vecteur. Soient M, (æ;, B,, Y1), M: (@», 
Be, Y2) deux points de l’espace. Ces points déterminent le vecteur 
M,M, qui possède certaines coordonnées par rapport à la base 
i, j, k. Etablissons la relation entre les coordonnées du vecteur M,M, 
et celles des points M,, M,. On a 


M,M —0M;—0M:. 


&—01090 
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Ensuite, d’après la définition des coordonnées affines des points 
M, M, 


OM;= Qui + Pa + Vak, OM;= Qoi + Bai + Vak. 
I] s'ensuit que 
MiMa=(a2— @) i+ (Be — Bi) j + (v2— V1) À 
ou, d’après les notations adoptées, 


MiMi=(@2— y, Pa — Pis Ve — V1). (25.1) 


Projections d’un vecteur. Reprenons le segment orienté M,M, 
de l’espace. Après avoir projeté les points M,, M, sur un plan ou un 
axe de coordonnées, on obtient un nouveau segment orienté. On dit 


que c'est une projection du vecteur M,M.. 

Chaque vecteur de l’espace possède six projections: trois sur les 
axes et trois sur les plans. Dans la base i, j, 4 les coordonnées des 
projections se calculent sans peine d’après les coordonnées des points 
M (@, Le h) M3 (@s, Be, V2). Il suffit d'utiliser les formules 
(23.8), (25.1). 

Aer par exemple, que nous calculons les coordonnées 
de la projection M,.M,.. Les coordonnées des points Mix, Mix 
étant 


Mie (æs, 0, 0), M2 (@os 0, 0), 
on trouve 
M xM 22 = (Go — &, 0, 0). (25.2) 
D'une façon analogue, 
Mix2M 21 = (Go — Qi, 0, Ye — Yi); 


et de même pour toutes les autres projections. 
En comparant la première des formules (23.4) avec les formules 
de la forme (25.2), on en déduit que 


{MixMoz} = Go—Q, {MiyMoy} = Br — Bi, {MM 12M oz} = Y2— 2— Vi. 


C'est pourquoi les mesures algébriques des projections du vecteur 
sur les axes coïncident avec les coordonnées de ce vecteur. 

La deuxième des formules (23.4) permet de calculer d’après les 
coordonnées des points M,, M, les longueurs des projections du vec- 


teur M,M, sur les axes de coordonnées. Plus précisément, 
| MixMox|= Qu, |[MiyMonl= Br |MiMal = Yi. 


Longueur du vecteur. Déduisons la formule de la longueur d’un 
vecteur de l’espace. Il est clair que la longueur | M,M, | du vecteur 
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MM, est égale à la distance p (W.,M.) entre les points'M,, M, et 
aussi à la longueur de la diagonale du parallélépipède rectangle, dont 
les faces sont parallèles aux plans de coordonnées et passent par les 


Fig. 25.1. 


points M,, M, (fig. 25.1). La longueur de toute arête du parallélé- 
pipède est égale à la longueur de la projection du vecteur M,M, 
sur l’axe de coordonnées parallèle à l’arête. En appliquant Île théo- 
rème de Pythagore, on en tire que 


[MM;|=(| MiM oz P+|MiM og +1] MM 22 P)/2. 


Si les points M, et M. sont donnés par leurs coordonnées M, (a, 
Pas Vi), Mo (@os Bas V2), il vient Ed 


P(M:, M2)=((@o— 0) + (B2—Bi)2+ (v2—v)2) 7. (25.3) 


Si c’est le vecteur M,M, qui est donné par ses coordonnées x, y, z 
dans la base i, j, k,on a , 


MM = (+42), (25.4) 


Dans le cas d’un plan, les formules sont analogues. Si les points 


Mi (@y, Br), Ma (@, B2) ou le vecteur M,M, = (x, y) sont donnés 
par leurs coordonnées, on a 


PO, M2) = (2 — 3) + (Be —B1)) 7, [MM |= (2 +2)". 


Angle formé par deux vecteurs. Considérons dans l’espace deux 
vecteurs non nuls a, b. Appliquons-les au point ©. Notons x le plan 
qui passe par © et qui contient ces vecteurs. On dit angle entre les 
vecteurs a et b pour l’angle minimal que forment ces vecteurs dans 
le plan x. Si au moins l’un des vecteurs est nul, l’angle n'est pas 
défini. Notre problème consiste à calculer le cosinus de l’angle com- 


6* 
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pris entre les vecteurs d’après les coordonnées de ces derniers. Ce 
cosinus est noté cos {a, b}. 

Désignons par À, B les extrémités des vecteurs a, b sur le plan x. 
I] est évident que l’angle entre les vecteurs a, b n'est rien d’autre 


Fig. 25.2. 


que l’angle AOB du triangle AOB dont les côtés sont les vecteurs a, 
b et b — a (fig. 25.2). 

Supposons que les vecteurs a, b soient donnés par leurs coordon- 
nées 


a = (ti, Yas 21), D = (Ze, Yos 22). 
Alors, 
b—a— (re — Ty, Ya — Yys 2e — Zi). 
On sait de la géométrie élémentaire que 
[b—aF=|a+1bf—21]al-1b ]|cos {a, b} 
ou, en tenant compte de (25.4), 
(za — 23) + (ye— y) + (22— 2) = ri + gi ++ ai ty +z— 
— 2 (+ vi +2) (284 vi + 25)" cos {a, b}. 
Des transformations élémentaires entraînent 
cos {a, À ru À Ve D (25.5) 


Les modifications à effectuer dans la formule pour le cas d’un plan 
sont évidentes. 

Division d’un segment dans le rapport donné. Soient dans l’espa- 
ce une droite et deux points distincts M, et M, de cette droite. 
Choisissons sur la droite une orientation positive. Sur l’axe ainsi 


obtenu, les points M, et M, déterminent le segment oriente M,M. 
Soit M un point quelconque de l’axe distinct de M,. Le nombre 


1 = {1M) (25.6) 
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est le rapport dans lequel le point M divise le segment orienté M,M.. 
Lorsqu'on inverse l'orientation de l'axe, les nombres {M,W} 


et {MM} changent de signe. Par conséquent, le rapport (25.6) 
ne dépend pas de l'orientation choisie de l’axe. Ensuite, en faisant 


varier l'unité de longueur sur l’axe,on multiplie {M,M} et {MM} 
par un même nombre. Le rap- 
port (25.6) ne dépend donc 
pas non plus de l'unité de 
longueur. Il s’ensuit que le 
rapport (25.6) ne dépend pas 
du choir du système de coordon- 
nées. 

Le problème consiste à cal- 
culer les coordonnées du 
point M quidivise le segment 
MM, dans le rapport À, si 
l'on connaît les coordonnées 
des points M,, M,et le nom- 
bre À ; de plus, À —1. Ainsi, 
soient Mi (@1, Pr, V1), Me (@, Fig. 25.3. 

Be, Y+) et supposons qu’on 

ne connaisse pas M (œ, B, y). Projetons ces points sur les axes de 
coordonnées, sur l’axe Oz, par exemple (fig. 25.3). En raison de 
l’homothétie le point M, divise le segment orienté M,.M,, dans 
le même rapport À. Donc 


_ {MixM LMisM x) (25.7) 
MM} Mo} 
D'après la formule (23.4), {M,.M.} = @ — a, {M;Max} = @ — @. 
Maintenant, compte tenu de (25.7), on trouve que & = (&, + 
LAae)/(14+ À). D'une façon analogue,on calcule les coordonnées f et y. 
Ainsi 
a = %1+Au B— B1 + Abe _ tv 
TT ADDX v PT ar. * A+X 


Remarquons que À >0 si M est à l’intérieur du segment M,M,;, 
À <<0, si M est à l'extérieur du segment M,M, et À = 0 si M coïn- 
cide avec M,. Lorsque le point M se déplace de M, vers M, (sans 
coïncider avec M.), le rapport À, nul au départ, prend successive- 
ment toutes les valeurs positives possibles dans l'ordre croissant. 
Si le point M se déplace de M, dans le sens positif de l’axe (cf. 
fig. 25.3), le rapport nul au départ prend ensuite les valeurs néga- 
tives dans l’ordre décroissant, en s’approchant autant que l’on 
veut de À = —1, mais en restant toujours supérieur à cette valeur. 
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Si le point M se déplace dans le sens négatif à partir de MW,, le rap- 
port À prend toutes les valeurs négatives possibles dans l’ordre crois- 
sant mais reste toujours inférieur à À = —1. 

Par conséquent, entre les nombres réels et les points d’une droite 
on pourrait établir une correspondance biunivoque, si la droite con- 


tenait un point Af divisant le segment M,M, dans le rapport À = 
= —1 et si on pouvait associer 
au point M coïncidant avec le 
point M, un nombre quelcon- 
que. On résout ce problème en 
complétant la droite par un 
« point» conventionnel appelé 
« point à l'infini », et l’ensem- 
ble des nombres par un « nom- 
bre» conventionnel dit « infini- 
ment grand ». 
Fig. 25.4. Projections orthogonales d’un 
vecteur. Soient un axe met un 
segment orienté AB dans l’espace. Menons par les points À,B des plans 
perpendiculaires à l’axe uw (fig. 25.4). Les intersections de ces plans 
avec l’axe définissent le; points À4,, B, dont À, appartient au 
même plan que À, et B, au même plan que B. Le segment orienté 
A,B, s'appelle projection orthogonale du segment AB sur l'axe u 
notée 


AB, = pre AB. 
L'axe u étant fixe, la projection orthogonale zx’ de chaque vec- 
teur x de l’espace est bien définie. On peut donc définir une fonction 
z' = Pr, (25.8) 
qui a pour variable indépendante un vecteur de l’espace, et pour 


valeur un vecteuride l'axe u. Nous allons prouver que cette fonction 
jouit des propriétés suivantes: 
lu (Z =pPruz+pr 
Pru(Zz+y)= pre z+ PruYs | (25.9) 
Pru (Az) — À Plu T, 


quels que soient les vecteurs zx et y et le nombre À. 
En effet, fixons un système de coordonnées cartésien dans lequel u 
coïncide avec l’axe des abscisses. Soient dans ce système 
Z = (@, Pis V1)» 
y — (Hs Be, Ya) 


z+y = (a + Goes Pa + Pers Ya + Ve) 
Àx = (AG, fus AYi)- 


alors 
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Dans le système cartésien choisi, la projection orthogonale du 
vecteur sur l’axe u coïncide avec sa projection sur l’axe! des ab- 
scisses. Nous avons déjà noté que la première coordonnée de la pro- 
jection de tout vecteur sur l’axe des abscisses se confond avec la 


première coordonnée du vecteur lui-même, les autres coordonnées 
étant nulles. C’est pourquoi 


Pru(z+y) =(œ +, 0, 0), 
pra (Az) = (Ac, 0, O), 
Pru TL — (@4, O, 0), 


(25.10) 
PTu Y = (te, 0, 0). | 
D'après les règles de l’addition des vecteurs et de leur multiplica- 
tion par un nombre, les deux dernières égalités de (25.10) entraï- 


nent 
Pru Z + Pru Y = (ai + &, 0, 0), 
À pr, z = (Aa, 0, O). 

En comparant les seconds membres des égalités obtenues avec les 
seconds membres des deux premières égalités de (25.10), on voit que 
les deux propriétés (25.9) sont justifiées. 

Soient maintenant x un plan dans l’espace et AB un segment 
orienté. En abaïissant des points À, B les perpendiculaires sur le 
plan x, on obtient sur le plan deux points 4, et B, qui déterminent 


le segment orienté 4,B,. Ce segment s'appelle projection orthogonale 
du segment orienté AB sur le plan x qu'on note également 


AxBx= pr x4B. 


Bien sûr, les projections orthogonales sur le même plan vérifient 
les relations analogues à (25.9). Pour le démontrer, on peut fixer 
un système cartésien tel que le plan x soit un plan de coordonnées 
et utiliser cette fois encore les propriétés correspondantes des projec- 
tions sur un plan de coordonnées. 

Nous avons étudié les projections orthogonales des vecteurs de 


l’espace. Evidemment, pour les vecteurs contenus dans un plan l’ana- 
logie est totale. 


Exercices 


4. Deux vecteurs non nuls sont donnés par leurs coordonnées cartésiennes. 
Quelle est la condition de leur orthogonalité? 

2. Chercher les coordonnées du barycentre des trois points matériels si 
l'on connaît leurs coordonnées cartésiennes et leurs masses. 


3. Calculer l'aire d'un triangle si l’on connaît les coordonnées cartésien- 
nes de ses trois sommets. 
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4. Soient zx, a, b, c des vecteurs non nuls de l’espace ; de plus, a, b, c sont 
deux à deux perpendiculaires. Montrer que 


cos®{z, a} + cos’ {r, b} + cos {r, c} — 1. 


5. Désignons par x un plan de coordonnées quelconque, par u un axe 
de coordonnées sur le plan x. Montrer que pour tout vecteur x 


Pru (Pr) = Pr,z. 


$ 26. Produit scalaire 


L'utilisation des segments orientés pour la représentation des 
forces et des déplacements conduit à la notion très importante de 
produit scalaire de vecteurs. 

La physique enseigne que si le vecteur a représente une force dont 
le point d'application se déplace de l’origine d'un vecteur b vers 
son extrémité, le travail w accompli par cette force est donné par 
l'égalité 

w = |al|bl]cos {ab}. (26.1) 


Le second membre de cette égalité est appelé produit scalaire des 
vecteurs a, b et noté d'habitude (a, b). Ainsi 


(a, bb = lal [b] cos {a, b}. (26.2) 


En toute rigueur, cette définition n’a un sens que pour les vec- 
teurs a, b non nuls, du fait que l'angle n’est défini que pour de tels 
vecteurs. Mais si l’on tient compte de l’origine de la notion de pro- 
duit scalaire, on comprend aisément comment cette définition doit 
être complétée pour le cas où au moins l’un des vecteurs est nul. Si 
la force ou le déplacement sont donnés par un vecteur nul, le travail 
est également nul. Aussi, di É ini moins l’un des vecteurs a, b est 
nul, posons nous (a, b) — 

La formule (26.2) Pere certaines propriétés géométriques du 
produit scalaire. Par exemple, l’angle entre deux vecteurs non nuls 
est aigu (resp. obtus) si et seulement si le produit scalaire de ces 
vecteurs est positif (resp. négatif). 

Si l’angle entre les vecteurs est droit ou au moins l’un des vecteurs 
est nul, leur produit scalaire est nul. Les vecteurs de ce type sont 
dits orthogonaux. 

Les vecteurs orthogonaux de longueur unité s'appellent vecteurs 
orthonormés. En particulier, les vecteurs de base ài, j, k d’un système 
de coordonnées cartésien sont orthonormés. La formule (26.2) en- 
traîne que 


(à, i)=1, (i, j) =0, (ë, k) = 0 
(j, i) =0, (j, j)=1, (7, k)=0, (26.3) 
(k, i)—=0, (k, j)=0, (k, k)=1. 
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Considérons deux vecteurs non nuls a, b. Menons par le vecteur 
a l’axe u en lui affectant une orientation telle que la mesure algé- 
brique du vecteur a soit positive. Il est alors évident que 


{pr, b} = |b | cos {a, b}. 


La projection du vecteur b sur l’axe construite de cette façon sera 
appelée projection du vecteur b sur le vecteur a et nous la noterons pr, b. 
Il est clair que la projection d’un vecteur sur un autre conserve les 
propriétés (25.9). Dans la nouvelle notation cela s'écrit 


(a, b) = |al {pr b} = 1b | {pre a}. (26.4) 


Ces formules permettent d'établir les propriétés algébriques 
très importantes du produit scalaire. Notamment, des vecteurs a, 
b, c quelconques et tout nombre réel & vérifient les relations 


1. (a, b) — (b, a), 

2. (aa, b) —=ai(a, b), (26.5) 

3. (a+b, c)—(a, c)+(b, c), 

4. (a, a)>0 pour a 0; (0, 0)—0. 

Remarquons que les relations (26.5) sont immédiates si au moins 
l’un des vecteurs est nul. Dans le cas général, la validité des pro- 
priétés 1, 4 résulte de la formule (26.2). Pour justifier les propriétés 


2, 3 utilisons les formules (26.4) et les propriétés des projections. 
On a 


(œa, b) = | b | {pre (aa)} = 1 b | {æ-prsa} — 
= «a |b] {pr, a} = « (a, b), 
(a@+b,c)=1lcl {pre(a + b)} = Icl {pra + pre b} = 
= [cl {pra} + lc {pre b} = (a, c) + (b, c). 
Les propriétés 2, 3 ne concernent que le premier facteur du pro- 


duit scalaire. Mais le deuxième facteur possède des propriétés ana- 
ogues. En effet, 


(a, ab) = (ab, a) = « (b, a) = « (a, b), 
(a, b+c)=(b+c, a) = (b, a) + (c, a) = (a, b) + (a, c)- 
De plus, en vertu de l'égalité a — b = a + (—1) b, on a les rela- 
tions 
(a LE b, c) — (a, c) De (b, c), 
(a, b — c) = (a, b) er: (a, c), 
puisque 
(a — b, c) = (a + (—1) b, c) = (a, c) + ((—1) 8, c) — 
= (a, c) + (—1) (b, c) = (a, c) — (b, c)- 
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Théorème 26.1. Si deux vecteurs a, b sont donnés par leurs 
coordonnées cartésiennes, le produit scalaire de ces vecteurs est égal à 
la somme des produits des coordonnées correspondantes multipliées deux 
à deux 

Démonstration. Supposons, pour fixer les idées, que les 
vecteurs sont donnés dans l’espace, c’est-à-dire que a = (x;, y:, 
Z1), b = (T2, Ys, 22). Puisque 


a = Ti + Yij + Ah, 
b = zii + y.j + z.k, 
en appliquant les propriétés du produit scalaire on trouve 
(a, b) = zite (, à) + miye (à, j) + 
+ Zi2e (à, À) + Yite O, à) + Yiÿe O, À) + 
+ Y12o Ü, À) + Zita (4, à) + Ziÿe (K, 7) + 2122 (ke k)- 
A présent, d’après (26.3), on a 
(a, bd) = ZiZo + YiYo + 2120, (26.6) 
et le théorème est démontré. 
La formule (26.6) permet d'exprimer les formules (25.4), (25.5), 


obtenues auparavant pour la longueur d’un vecteur et l’angle entre 
deux vecteurs, par le produit scalaire: 


[al= (a, a)'®, ) 
: 26.7 
cos {a, = ET. [ Et 


Il peut paraître que ces formules sont triviales du fait qu'elles 
se déduisent immédiatement de (26.2) sans aucune référence aux 
formules (25.4), (25.5). Or, n'accélérons pas les choses et prêtons 
toute notre attention à la circonstance suivante. 

Notre discussion compte trois étapes. D'abord, en s'appuyant 
sur la formule (26.2) nous avons démontré les propriétés (26.5). 
Puis, forts seulement de ces propriétés et du fait que les vecteurs de 
base sont orthonormés nous avons établi la formule (26.6). Et enfin, 
en utilisant les formules (25.4), (25.5) déduites sans recourir à la 
notion de produit scalaire de vecteurs, nous avons obtenu les for- 
mules (26.7). 

Ceci dit, on pourrait définir le produit scalaire non pas par sa 
forme explicite, mais axiomatiquement comme fonction numérique 
valable pour chaque couple de vecteurs et vérifiant les propriétés 
426.5). Alors, dans tout système de coordonnées dont les vecteurs 
de base sont orthonormés dans le sens du produit scalaire axioma- 
tique on aurait encore la relation (26.6). Par conséquent, on pourrait 
définir axiomatiquement la longueur d'un vecteur et l'angle entre 
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deux vecteurs à l’aide des formules (26.7) suggérées par le cas du 
système cartésien. Bien sûr, il faudrait encore voir si les longueurs 
et les angles introduits de cette façon possèdent les propriétés requi- 
ses. 


Exercices 


1. Soient a et b deux vecteurs. Dans quelles conditions imposées au 
nombre «& les vecteurs a et b + «a sont orthogonaux? Quelle est l’interpré- 
tation géométrique de ce problème? | 

2. Ün vecteur a est donné dans l’espace V, par ses coordonnées cartésiennes. 
Trouver deux vecteurs linéairement indépendants orthogonaux au vecteur a. 

3. Deux vecteurs linéairement indépendants a, b sont donnés dans l’espace 
V, par leurs coordonnées cartésiennes. Trouver un vecteur non nul orthogonal 
aux deux vecteurs. 

4. Le lieu géométrique des vecteurs orthogonaux à un vecteur donné, que 
représente-t-il ? 


$ 27. Espace euclidien 


Les espaces vectoriels abstraits dont nous avons déjà fait con- 
naissance sont dans un certain sens plus pauvres en notions et pro- 
priétés que les espaces des segments orientés. Il en est ainsi avant 
tout parce qu’ils ne traduisent pas les faits les plus importants rela- 
tifs à la mesure des longueurs, des angles, des surfaces, des volumes, 
etc. Pour étendre les notions métriques aux espaces vectoriels abs- 
traits on peut procéder de diverses manières. Pourtant, le moyen le 
plus efficace de rendre possible la mesure est d'introduire axzioma- 
tiquzment le produit scalaire de vecteurs. Nous commencerons l’étude 
par lés espaces vectoriels réels. 

Un espace vectoriel réel Æ est dit euclidien si à chaque couple de 
vecteurs zx, y de E on fait correspondre un nombre réel (x, y) appelé 
produit scalaire tout en vérifiant les axiomes suivants: 


1. (z, y)  —=(y, 2), 
2. (Az, y) —=2(xz, y), (27.1) 
3. (z + y, z)=(z, z) + (y, z), 
&. (x, z)>0 pour x#0; (0, 0)=0, 
quels que soient les vecteurs z, y,z de E et le nombre réel À. 
Nous savons déjà que ces axiomes permettent d'appliquer aux 


produits scalaires certaines transformations algébriques formelles, 
c'est-à-dire 


(Das À 6m)= À À abr(ar v) 


pour n'importe quels vecteurs z;, y, et nombres &;, 6; quelle que 
soit la quantité r, s de termes. 
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Tout sous-espace vectoriel Z d'un espace euclidien Æ£ devient 
lui-même espace euclidien si l’on y conserve le produit scalaire 
introduit dans E. 

Signalonsune méthode générale pourintroduire un produit scalaire 
dans un espace réel arbitraire X. Soit e,, e., . .., e, une base dans 
cet espace. Prenons deux vecteurs quelconques x, y de Æ et sup- 
posons que 


z = Eje + ses +... + bnen, 

Y = Me + Note + + + + + Nnen- 
Le produit scalaire peut être défini à présent de la façon suivante: 
(x, y) = Emi + Eole +... + Ennn. (27.2) 


On vérifie sans peine tous les axiomes. Par suite, l’espace vectoriel 
K muni de produit scalaire (27.2) est un espace euclidien. 

Remarquons qu'il existe d’autres techniques pour introduire Île 
produit scalaire dans l’espace ÆX. Par exemple, dans cet espace, l’ex- 
pression 


(x, y) = ibn + Goboo + : . . + AnEnln 


sera aussi un produit scalaire quels que soient les nombres positifs 
fixes @,, &+, . . ., &n. Cette non-univocité ne doit point nous em- 
barrasser. I] n’y a rien d'étonnant dans le fait que les longueurs peu- 
vent être mesurées en mètres et en pouces, les angles en degrés et 
en radians, etc. C’est précisément ce fait qui permet de mieux éva- 
luer les propriétés des espaces concrets en les munissant d’un pro- 
duit scalaire. ; 

En munissant l’espace des segments orientés d’un produit sca- 
laire il nous fallait considérer spécialement le cas où au moins l’un 
des segments était nul. Nous admettions alors que le produit sca- 
laire était nul. Maintenant, grâce aux axiomes (27.1), ce fait de- 
vient une propriété. Si x est un vecteur arbitraire de £, il vient 


(0, x) = (0x, x) = 0 (x, x) = 0. 
Certes, le premier axiome (27.1) entraîne (x, 0) = 0. 
Le vecteur x d’un espace euclidien est dit normé si (x, x) = 1. 


Tout vecteur non nul y peut être normé si on le multiplie par un 
nombre À. En effet, par hypothèse, 


(Qy, Ay) = À (y, y) = 1. 
On peut donc prendre comme facteur normalisant 
A=(y, y). 


Un système de vecteurs est dit normé si tous ses vecteurs sont 
normés. Il résulte de ce qui vient d'être dit que tout système de 
vecteurs non nuls peut être normé. 
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L'une des propriétés les plus importantes d’un produit scalaire 
est donnée par le 

Théorème 27.1. (inégalité de Cauchy-Bouniakovwski). Quels 
que soient les vecteurs x, y d’un espace euclidien, ils vérifient l'inégalité 


(x, y < (x, 2) (y, y). 


Démonstration. Le théorème est immédiat si y — 0; 
considérons donc le cas où y 0. Examinons le vecteur x — Ày, 
où À est un nombre réel arbitraire. On a 


(x — y, z — Ày) = (x, x) — 22 (x, y) + À (y, y). 


Le premier membre est un produit scalaire de vecteurs égaux. C’est 
pourquoi le trinôme du second degré du second membre est non né- 
gatif pour tout À, en particulier, pour 


(z,_ y) _ 
un (s y)” ee) 
Ainsi, 
_o (x, y) (x, y} ” __ (& g* 
(&, 2) 2 y) G + (y, y)? (y, y)=(z, 2) (Y, ÿ) 20, 


d’où la proposition du théorème. 

D'une façon analogue aux espaces des segments orientés disons 
colinéaires pour deux vecteurs x, y d’un espace vectoriel quelconque si 
ou bien z = Ày, ou bien y = ux pour certains nombres à, u. Vu 
l'égalité 0 = 0x, on déduit que deux vecteurs sont colinéaires si au 
moins l’un d'eux est nul. Pour vérifier la colinéarité des vecteurs 
il est très commode d'appliquer l'inégalité de Cauchy-Bouniakovski 
en se basant sur le 

Théorème 27.2. L'inégalité de Cauchy-Bouniakovski devient 
égalité si et seulement si les vecteurs x, y sont colinéaires. 

Démonstration. Soient x, y deux vecteurs colinéaires. 
Pour fixer les idées, supposons que x = Ày. Il vient 


(x, y)° = (y, y)° = À (y, y}, 
(x, z) (y, y) = (y, Ay) (y, y) = M (y, y}°. 
En comparant ces égalités on démontre que la proposition du théo- 
rème est suffisante. 
Supposons maintenant que pour certains vecteurs zx, y soit véri- 
fiée l'égalité 
(x, y)° = (x, z)(y, y). (27.4) 


Si y = 0, les vecteurs sont colinéaires. Mais si y 0, en choisis- 
sant À d’après (27.3) et en tenant compte de (27.4) on n obtient 


(z — Ày, zx — Ày) = 0. 
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En vertu du dernier axiome (27.1) cela signifie que z — Ày — 0 
ou que z = Ày, c'est-à-dire que les vecteurs z, y sont colinéaires. 
Nous avons démontré par là que la proposition du théorème est 
également nécessaire. 

A titre d'exemple examinons l’espace R,. On peut le rendre eu- 
clidien si, pour les vecteurs 


T — (@1s ss - + -9 Gn); 
y — (B2 Bas 7 Ba); 


le produit scalaire est introduit de la façon suivante: 


(z, y) = 2 @iBs- (27.5) 


Il est évident que les axiomes (27.1) sont respectés. Dans notre cas, 
l'inégalité de Cauchy-Bouniakovski signifie que 


(È m8) <(S at) (D 8) (27.6) 
1 i=1 i=1 


quels que soient les nombres réels a;, Bi. 


Exercices 


1. Comment munir d’un produit scalaire un espace des polynômes à une 
inconnue à coefficients réels? 

2. L'espace R, deviendra-t-il euclidien si le produit scalaire y est introduit 
de la façon suivante 


(x, y)= D laillB:1? 
i= 1 


3. Donner une interprétation géométrique de l'inégalité de Cauchy-Bounia- 
kovski dans l’espace des segments orientés. | 
4. Montrer que x = y si et seulement si (x, d) = (y, d) pour tout vecteur d. 


$ 28. Orthogonalité 


La relation la plus importante entre les vecteurs d’un espace 
euclidien est l’orthogonalité. 

Par définition, deux vecteurs x, y sont dits orthogonauz si (x, y) — 
— 0. En raison du premier axiome (27.1) la relation d'orthogonalité 
de deux vecteurs est symétrique. Dans l'espace des segments orientés, 
la notion d'’orthogonalité coïncide en principe avec celle de perpen- 
dicularité. Il en résulte que l'’orthogonalité peut être envisagée 
comme extension de la notion de perpendicularité aux espaces eucli- 
diens abstraits. 
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Un système de vecteurs d’un espace euclidien est dit orthogonal 
s'il est composé d’un seul vecteur, ou bien si ses vecteurs sont ortho- 
gonaux deux à deux. Mais si un système orthogonal se compose de 
vecteurs non nuls, il peut être normé. Un système orthogonal normé 
est dit orthonormé. 

L'intérêt des systèmes orthogonaux et orthonormés s’explique 
par des avantages qu'ils présentent pour l'étude des espaces eucli- 
diens. 

Ainsi, tout ensemble orthogonal des vecteurs non nuls et, cer- 
tainement, tout système orthonormé, est linéairement indépendant. 
En effet, soit z1, Ze, . . ., TZ, un système orthogonal et x; = 0 pour 
tout i. Cela signifie que (x;, x;) = 0 pour i jet (xz;, zy) 5 Ô pour 
1 = j. Ecrivons l'égalité 

GT + Gta +... + arts = (0. 


En multipliant scalairement cette dernière par n’importe quel vec- 
teur z;, on obtient 


Q1 (Zi, Z1) + Ga (zu, Ze) +... + an (xs, 2x) = 0. 


Il en résulte 
@ (ris Ti) = 0 (28.1) 


et, certes, a; = 0. Ainsi, le système de vecteurs z1, Ze, . - ., TR 
est linéairement indépendant. 

L'égalité (28.1) entraîne en particulier que si la somme de vec- 
teurs orthogonaux deux à deux est nulle, alors tous les vecteurs sont 
nuls. 

L'hypothèse d'après laquelle un système orthonormé e;, e:, ... 

.., €, peut servir de base à un espace euclidien Æ, entraîne plu- 
sieurs corollaires utiles. Dans ce cas, chaque vecteur x de £ se met 
d’une façon unique sous la forme de la combinaison linéaire 


ZT = Or + Gua +... + Asese 


Mais la multiplication scalaire de cette égalité par e, donne une ex- 
pression explicite des coefficients de la décomposition suivant la 
base. Notamment, 


ay = (x, 6). (28.2) 
Si un autre vecteur y a pour décomposition 
y = Pres + Pres +... + fie, 
de simples transformations fournissent 
(x, y) = @iba + Gps +... + ap. (28.3) 
En particulier, 
(z, z)= ai +ai + ... + ai. (28.4) 
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Avant de poursuivre notre étude, voyons s'il existe une base de 
vecteurs orthonormés. 

Une base dont les vecteurs forment un système orthonormé est 
dite orthonormée. L'existence d’une telle base dans un espace eucli- 
dien est prouvée par le 

Théorème 28.1. Dans tout espace euclidien E de dimension 
finie il existe une base orthonormée. 

Démonstration. Soit dim Æ — nr. Un système ortho- 
normé est linéairement indépendant, il ne peut donc pas contenir plus 
de nr vecteurs. Supposons qu’un système e1, €, .- . ., €, Compte un 
nombre maximal de vecteurs orthonormés. Cela signifie qu’il n'existe 
dans l’espace Æ aucun vecteur non nul orthogonal à tous les vecteurs 


Ep» ay + - - 68. Si un vecteur est orthogonal à ces derniers, il doit 
être nul. 

Soit z un vecteur quelconque de £. Si le système orthonormé 
€ Car - + :» Es était une base, le vecteur x devrait coïncider avec 


le vecteur y: 
y — (z, €) €1 + (x, €) Ca + .…. gs © (zx, es) ls. 


Examinons donc le vecteur zx — y. On a 


(z—y, e)=(z— 2 (x ep) Ep e;) = 


s 

=(z, €) — à (z, ep) (ep e;)=(z, e;)— (zx, e;) =0. 

Le vecteur z— y s'avère orthogonal à tous les vecteurs e:, e:..., es. 
Donc, z — y = 0 ou zx = y. 

Ainsi, le système linéairement indépendant e;, e:, . .., e, pos- 
sède cette propriété que tout vecteur de l’espace E s'exprime linéai- 
rement par ses vecteurs, c’est-à-dire que ce système forme une base. 

Corollaire. Tout système de vecteurs orthonormé ex, e>, ... 
..., ex peut être complété jusqu'à une base orthonormée. 

En effet, prenons parmi les systèmes orthonormés qui contiennent 
le système donné celui dont le nombre de vecteurs est maximal. 
Supposons que ce soit le système e1, - . ., ex, en+1, - - ., €. En repre- 
nant mot à mot la démonstration du théorème 28.1, on établit que 
le nouveau système est une base. 

Outre les vecteurs orthogonaux d'un espace euclidien, nous allons 
étudier également les ensembles orthogonaux des vecteurs. Deux en- 
sembles F et G d’un espace euclidien £ sont dits orthogonaux si 
chaque vecteur de F est orthogonal à chaque vecteur de G. L’ortho- 
gonalité de F et de G est notée F 1 G. 

Un ensemble peut bien se composer d’un seul vecteur. Si un vec- 
teur d’un ensemble est orthogonal à l’ensemble tout entier, il est 
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en particulier orthogonal à lui-même. Par conséquent, il ne peut 
qu'être nul. 

Lemme 28.1. Pour qu'un vecteur x soit orthogonal à un sous- 
espace L il faut et il suffit qu’il soit orthogonal à tous les vecteurs d'une 
base de ce sous-espace. 

Démonstration. Choisissons une base ÿ1, Y2, . - .; Un 
du sous-espace L. Si x L L, x est orthogonal à tous les vecteurs de L, 
et en particulier, aux vecteurs ÿYy, Yas + + -, Yr. Soit maintenant 
(z, y) = 0 pour tout i. Prenons un vecteur quelconque z de L et 


décomposons-le par rapport aux vecteurs de base. Si pour certains 
nombres @i, Œs, - - ., GR 


Z = ŒiY1 + UoUe + - . . + ŒuYhs 
il vient 


(x, z) SE (x, Qiÿ1 So Œoya + Ts aryx) = 
— 1 (zx, Ya) + Ga (x, y) Tes. À (x, yK) = (0. 


Cela signifie que z L L. 
Corollaire. Pour que deux sous-espaces soient orthogonaux, 
il faut et il suffit que tout vecteur d'une base de l'un des sous-espaces 
soit orthogonal à tous les vecteurs d'une base de l’autre sous-espace. 
La somme XÆ des sous-espaces vectoriels Li, La, . .., LA est 
dite orthogonale si les sous-espaces sont orthogonaux deux à deux. 
Pour la somme orthogonale nous allons employer la notation 


K = L, @ L: D ... ® Ln- 


Lemme 28.2. Une somme orthogonale des sous-espaces non nuls 
est toujours une somme directe. 

Démonstration. Choisissons dans chaque sous-espace 
une base orthonormée et considérons le système de vecteurs qui est 
une réunion des bases de tous les sous-espaces. Il est clair que 
chaque vecteur de la somme orthogonale s'exprime linéairement par 
les vecteurs du système construit. Mais ce système est linéairement 
indépendant, étant composé de vecteurs non nuls deux à deux ortho- 
HE Maintenant la proposition du lemme se déduit du théorème 
20.1. 

Supposons qu’un espace euclidien Æ soit somme orthogonale 
de ses sous-espaces Li, L:, . . ., L,:; alors, la collection de ces sous- 
espaces peut être considérée comme une base orthogonale généra- 
lisée. En particulier, si nous écrivons pour deux vecteurs quelcon- 
ques zx, y de X leurs décompositions par rapport aux sous-espaces Li, 
Les : + Lm C'est-à-dire si nous les mettons sous la forme 


ZT =L Tate... + Zm 


Yy = Yi t Ya +... + Yms 
7—01090 
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où z;, y; E L:;, il sera facile de voir que 
(z, y) = (1, Ya) + (Ces Ya) + + +: + (ms Ym). (28.5) 


La formule obtenue est analogue à (28.3. 

Considérons un ensemble arbitraire non vide F des vecteurs de 
l’espace euclidien ÆE. L'ensemble de tous les vecteurs orthogonaux 
à F s'appelle complément orthogonal de l’ensemble F et se note F1. 
Le complément orthogonal est un sous-espace. En effet, si les vec- 
teurs z,yEF1,onazx,y 1 F. Mais alors ax + By 1 F pour n’im- 
porte quels nombres a, B, c'est-à-dire ax + y € F1. 

Théorème 28.2. Un espace euclidien est une somme ortho- 
gonale de l’un quelconque de ses sous-espaces vectoriels L et de son com- 
plément orthogonal L1, c'est-à-dire 


E=L@L*. 


Démonstration. Soient dim L = s, dim Li = m. Choi- 
sissons une base orthonormée e,, . .., e, du sous-espace L et une 
base orthonormée r1, . . ., rm du sous-espace Li. Le système de 
vecteurs €, . . ., ss lis + + :s l'm est orthonormé et, par suite, linéai- 
rement indépendant. 

Si ce système n'est pas une base de Æ, on peut le compléter 
jusqu’à une base orthonormée. Soit e l’un des vecteurs complémen- 
taires. Il est orthogonal aux vecteurs e;, . .., e,, c'est pourquoi 
e L L, c'est-à-dire e € Li. Ainsi, le vecteur e appartient à L, tout 
en étant orthogonal à L1. Il s’ensuit que e = 0, ce qui prouve le 
théorème. 

La décomposition de l’espace en une somme orthogonale de ses 
sous-espaces rend efficaces de nombreuses recherches. En voici une 
illustration. | 

Soient £ un espace euclidien et z1, Z:, . . ., zx le système de ses 
vecteurs. Si le rang de ce système est égal à la dimension de E, il est 
évident que l'unique vecteur de Æ orthogonal à tous les vecteurs du 
système donné sera le vecteur nul. La réciproque est également vraie: 

Lemme 28.3. Si dans un espace euclidien on donne un système 
de vecteurs z1, Ta, . . -, Tr et si l'unique vecteur de E orthogonal à ces 
derniers est le vecteur nul, le rang du système est égal à la dimension de E. 

Démonstration. Désignons par L l'enveloppe linéaire 
du système de vecteurs Zy, Ze, - . ., Zn. Tout vecteur orthogonal à 
ces vecteurs est orthogonal à L, puisqu'il appartient au complé- 
ment orthogonal Li. D'après la condition du lemme, le sous-espace 
L+ n'est composé que de vecteur nul. Etant donné que £ = L @ Li, 
on en tire que la dimension de Z coïncide avec celle de ÆE. Mais la 
dimension de Z est égale au rang du système de vecteurs z1, z:, . . - 

., Tr. Le lemme est démontré. 
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Exercices 


4. Montrer que si le produit scalaire de deux vecteurs quelconques d’un 
espace euclidien s'exprime par l'égalité (28.3), la base qui a servi pour obtenir 
les coordonnées est  orthonormée. 

2. Montrer que si le produit scalaire de tout vecteur d'un espace euclidien 
ar lui-même s'exprime par l'égalité (28.4), la base qui a servi pour obtenir 
es coordonnées est orthonnrmée. 

3. Montrer que si deux ensembles composés d’un nombre fini de vecteurs 

sont orthogonaux, leurs enveloppes linéaires le sont également. 

.4. Montrer que l'intersection de deux sous-espaces orthogonaux se compose 
du seul vecteur nul. 

5. Montrer que si un espace euclidien est une somme directe de ses sous- 
espaces et que n'importe quels deux vecteurs vérifient l'égalité (28.5), les sous- 
espaces sont orthogonaux deux à deux. 

6. Montrer que les sous-espaces L, M quelconques d’un espace euclidien E 
vérifient les relations 


dim L+dim£Li=dimE, 
(L1)1=L, 
(L+M)i=LinMt, 
(LNnM)i=Lit+Mt. 


$S 29. Longueurs, angles, distances 


Etendons maintenant les notions de longueur, d'angle et de 
distance aux éléments d’un espace euclidien. À cet effet nous allons 
nous fonder sur l’analogie avec les espaces des segments orientés. 

On appelle longueur | x | d’un vecteur x d’un espace euclidien Æ 
la quantité ; 


Izl= + (x, 2). 


Chaque vecteur possède une longueur. D'après le dernier axiome 
(27.1), elle est positive pour les vecteurs non nuls et nulle pour le 
vecteur nul. Ensuite, l'égalité 


jAz|= (Ar, A) = (N(x, 2) = |Al|z| 


montre qu] est possible de sortir du signe de la longueur de la va- 
leur absolue du facteur numérique À. Nous avons déjà dit qu’un vec- 
teur non nul peut être normé, c'est-à-dire multiplié par un nombre 
tel que la longueur du vecteur obtenu devint unitaire. 

L'angle {x, y} entre deux vecteurs non nuls x, y d’un espace eucli- 
dien Æ est défini par les relations 


cos{x, net, OL{z, y}< sr. 


Si parmi les vecteurs z,y il y a au moins un vecteur nul,l’angle entre 
eux n'est pas défini. 
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L’inégalité de Cauchy-Bouniakovski montre que l'expression 
appelée cosinus de l'angle entre les vecteurs ne dépasse pas l'unité 
en module. C'est pourquoi quels que soient les vecteurs non nuls, 
l’angle entre eux est toujours bien défini. [Il ne change pas si l'on mul- 
tiplie les vecteurs par un nombre positif et, d’après le théorème 27.2, 
il vaut 0 ou x si et seulement si les vecteurs non nuls sont colinéaires. 
Tout ceci s'accorde parfaitement avec la notion d'angle entre deux 
segments orientés. 

Soient z, y deux vecteurs non nuls. Vu l’analogie avec les seg- 
ments orientés, considérons ces vecteurs comme deux côtés d’un 
triangle. Il est logique de prendre pour le troisième côté du triangle 
le vecteur x — y. En utilisant la notion de longueur d'un vecteur et 
d'angle entre deux vecteurs, on trouve 


Iz—yÉ = (z—- y, z — y) = (zx, z) — 2 (x, y) + (y, y) — 


= [x +l|yF—-21xz] ]|ylcos {x, y}. 
(29.1) 


Ainsi, nous avons montré que dans un espace euclidien le carré 
de la longueur d’un côté d’un triangle est égal à la somme des carrés 
des longueurs des autres côtés sans le double produit des longueurs 
de ces côtés par le cosinus de l'angle entre eux. 

Si le triangle est rectangle, c'est-à-dire si l’angle entre les vec- 
teurs x, y est droit, il est évident que 


[z—yÉ-IzF+lyf. (29.2) 


C'est une généralisation formelle du célèbre théorème de Pytha- 
gore. 

Considérons une fois encore un triangle arbitraire. Le cosinus de 
l’angle de deux vecteurs ne dépassant pas l’unité en module, (29.1) 
entraîne 


Iz—yF<(Izl+ly|}, | 
|z—yP>(|zl—1|yl) 
|z—y|<|z|+1y|, | 

29.3 
z—yl>lzl | Il S 


Ainsi, dans un espace euclidien, la longueur du côté d'un tri- 
angle ne dépasse pas la somme des longueurs des deux autres côtés, 
mais n'est pas inférieure à la différence entre ces longueurs. 

On appelle distance p (x, y) entre deux vecteurs x, y d’un espace 
euclidien la quantité 


pis y =lrz-yl. (29.4) 
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Elle possède les trois propriétés de la distance qui apparaissent 
naturellement dans les espaces des segments orientés (lorsqu'on 
interprête les vecteurs comme des points!). Plus précisément, quels 
que soient les vecteurs z, y, z d'un espace euclidien, on a 


1. px, y)=P(y, x), 

2. p(r, y>0, si rzy, 
p(z, y)}—=0, si zx=—y, 

3. pr, y)<P(z, z)+P(z. y). 


(29.5) 


Les deux premières propriétés sont immédiates. La dernière n'est 
rien d'autre qu'une généralisation de l’« inégalité triangulaire » 
connue. Elle se déduit de la première inégalité (29.3) si x est rem- 
placé par z — z et y par y — Zz. 

On appelle distance p (A, B) entre deux ensembles À, B des vec- 
leurs d'un même espace la quantité 


p(4, B)= inf p(z, y). 
x€A, r€EB 


Pour terminer, signalons la circonstance suivante. Soit e:, 
es, - - ., €, une base orthonormée dans un espace euclidien. Quels 
que soient deux vecteurs x, y donnés par leurs coordonnées, 


ZT — (@, Œ 2; M RTE Gs); y Fe (Bas B>, | B.) 
par rapport à cette base, on a, d’après (28.3), 


z|= (@i + ai + ... + 2)!” 
et puis, 
Bi + fr + ... +ashs 
COST, y} = — "© " ———" " —— |, 
HE (aÿ+ ... +ai)/" (+ ... +p2)1/2 
Il est évident que l’analogie avec les formules (25.4), (25.5) est 
totale. 
Ainsi, les notions de longueur, d'angle et de distance que 
nous avons introduites s'accordent parfaitement avec les notions 
analogues des espaces des segments orientés. 


Exercices 


1. Montrer que la longueur de la somme d’un nombre quelconque de vec- 
teurs ne dépasse pas la somme des longueurs de ces vecteurs. 

2. Montrer que le carré de la somme d'un nombre quelconque de vecteurs 
orthogonaux est égal à la somme des carrés des longueurs de ces vecteurs. 

3. Trouver dans l’espace euclidien des polynômes à une variable + les angles 
du triangle formé par les vecteurs 1, {*, 1 — #2. 
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4. Quelle est la distance entre les polynômes 32? + 6 et 28 + 1 + 1? 

5. Montrer que dans un espace euclidien un triangle est rectangle si et 
seulement si laïlongueur d'un côté est égale au produit de la longueur d’un 
autre côté par le cosinus de l'angle entre eux. 


$ 30. Oblique, perpendiculaire, projection 


Avant d'étendre les notions d’oblique, de perpendiculaire et de 
projection aux espaces euclidiens abstraits, revenons aux espaces 
des segments orientés. | 

Soit L un plan. Abaissons sur ce plan à partir du point M la 
perpendiculaire et désignons son pied par M, (fig. 30.1). Pour donner 
à ce problème une interprétation vectorielle choisissons sur le plan Z 

un point © et examinons l'espace 


M V, des segments orientés fixés en O. 
N Le plan ZL forme un sous-espace. 
C'est pourquoi la construction de 
la perpendiculaire abaissée de M 
sur le plan L se ramène à décom- 


EE — poser le vecteur Of de l’espace 
en une somme 


OM=0Mi+M:M, (30.1) 


Fig. 30.1. oùO0M, ELet MLM ZL L. Il dé- 

coule des considérations géomé- 

triques que la décomposition (30.1) existe toujours et qu’elle est 
unique. 

_Cet exemple suggère comment le problème de la perpendiculaire 
doit être posé dans le cas général. Supposons que dans un espace eu- 
clidien on ait un sous-espace ZL. Choisissons un vecteur arbitraire / 
de E et voyons s’il est possible de le décomposer en une somme 


f=s+h (30.2) 


où gELet k 1 L. 

Nous avons déjà vu ce problème. En effet, la condition À L L 
est équivalente à la condition k € Li. D'après le théorème 28.2, 
l’espace euclidien Æ est somme directe des sous-espaces ZL et Li. 
Il s'ensuit que la décomposition (30.2) existe toujours et est unique. 

Par analogie avec (30.1), appelons le vecteur g de la décomposition 
(30.2) projection du vecteur f sur le sous-espace L, h perpendiculaire 
abaissée du vecteur f sur L et le vecteur f lui-même, oblique par rapport 
au sous-espace L. 

On sait que dans la géométrie élémentaire la longueur de la per- 
pendiculaire ne dépasse jamais la longueur de l'oblique. Une situa- 
tion analogue a lieu dans un espace euclidien. Les vecteurs g, À 
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de la décomposition (30.2) sont orthogonaux. Il en résulte d’après 
le théorème de Pythagore que 


IfF=lgF+IRkE, 
d'où 
LAE “SEA 


Il est clair que la longueur de la perpendiculaire À au sous-espace L 
est égale à la longueur de l’oblique par rapport au même espace si 
et seulement si f L L. 

Le problème de la perpendiculaire peut avoir une autre interpré- 
tation. Examinons une fois encore un vecteur arbitraire f de Æ. 
Il n'est pas de rigueur que ce vecteur appartienne au sous-espace Z. 
On peut donc se proposer de trouver dans Z un vecteur qui soit le 
plus proche de f dans le sens de la distance introduite plus haut. 

Soit z un vecteur de Z. En le retranchant des deux membres de 
l'égalité (30.2), on obtient 


f—:=(g—z)+h. 


Puisque le vecteur = est orthogonal au vecteur g — z, on a d’après 
le théorème de Pythagore 


lf—zF=lg—-2zF+IkR}, 
d'où 
| — 2 | Z | k |, 
l'égalité étant possible si et seulement si z = g. 


Ainsi, parmi tous les vecteurs du sous-espace Z, la projection du 
vecteur f sur Z est la plus proche du vecteur f. Cela signifie que 


pU, L)=p(, 8). L" 

Par analogie avec les segments orientés appelons angle entre le 

vecteur f et le sous-espace L l’angle minimal entre le vecteur f et les 

vecteurs z de L. En tenant compte de l'inégalité de Cauchy-Bounia- 
kovski et de la décomposition (30.2), on a 


__ (f, 2) __ (g+h,2) ___ (&, 2) gl! 
D LE TE Da ET EN AE 1 


Il est évident que cette inégalité devient égalité si et seulement si 
l'angle entre le vecteur z et le vecteur g est nul. 

On voit donc que l’angle entre le vecteur f et le sous-espace Z 
coïncide avec l'angle entre le vecteur f et sa projection sur le sous- 
espace L. 

Les propriétés constatées de la perpendiculaire et de la projec- 
tion reflètent l'aspect géométrique de ces notions. Nous allons les 
étudier à présent du point de vue algébrique. Pour un sous-espace 
fixe L les deux composantes de chaque vecteur f d’un espace eucli- 
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dien Æ sont bien définies par rapport à L. Par conséquent, on peut 
admettre que la décomposition (30.2) fournit deux fonctions 


— Pr}, 
hk — ortr f. 


La variable indépendante de ces fonctions peut être un vecteur 
de F, les valeurs de la fonction pr; f, peuvent être les vecteurs de Z, 
celles de la fonction ort, f, les vecteurs de Li. 

En vertu de la relation (L1)1 — Z, la perpendiculaire et la pro- 
jection sont liées par les égalités 


PrL Î= ort,;1 Î, 
ortrf=pr,:f. 


Aussi, l'étude de ces fonctions se ramène-t-elle en fait à l’étude de 
l’une d'entre elles. 

Soient x, y deux vecteurs de E. D’après la décomposition (30.2), 
on a 


(30.3) 


Z=PrLzrz+ortrx, | (30.4) 


y = przy+ortry. 


En ajoutant ces égalités membre à membre et en multipliant la 
première d’entre elles par un nombre arbitraire À, on obtient 


ZT + y — (pri XI -+ Pr£ y) + (ortz z + Ortz y), 
Àz = (À prz x) + (À ortz x). 


Une vérification directe. montre que les vecteurs des premières pa- 
renthèses appartiennent à L, ceux des deuxièmes sont perpendicu- 
laires à L. D’après l’unicité des décompositions de la forme (30.2), 
cela traduit la validité des relations 


Prz(z+y)=prLz+PrLy, 
PrLAZ=ÀPrLxZ | (80.5) 
pour la fonction pr. et, certes, des relations analogues 
ortL(xz—+y)=ortzz+ortzy, | 
ortL (Az) = ortz x (69:8) 


pour la fonction ort,. Les formules (25.9) et (30.5) coïncident com- 
plètement. 

Constatons que ortz z — 0 pour tout vecteur z de ZL. La première 
égalité (30.6) entraîne donc 


ort, (x + z) — ortz (x). 


$ 30 OBLIQUE, PERPENDICULAIRE, PROJECTION 105 


Par suite, la valeur de la fonction ort, ne change pas si on ajoute à 
la variable indépendante un vecteur quelconque du sous-espace L. 


En particulier, si l’on prend z2 = —pr,; x, on obtient, compte tenu 
de (30.4), 
ortr (ortz x) — ortr T. (30.7) 
Pour la projection, la relation est analogue. Plus précisément, 
Prz (Prz Z) = Prz x. (30.8) 


Supposons maintenant qu’un sous-espace L est la somme ortho- 
gonale des sous-espaces L, et L.. Choisissons un vecteur arbitraire x 
de Æ£ et mettons-le sous la forme d’une somme 


Z = (pr T — Pre, €) + (TZ — pri, ? — Pr, à). 


Le vecteur des premières parenthèses appartient évidemment au 
sous-espace Li @ L:. Le vecteur des deuxièmes parenthèses est 
orthogonal à L, @ L,; on le voit aisément en le transformant à 
l’aide des relations (30.4): 


Z—Priil— Prist=Oorly, Z—priz—=ortr,z—prr,z. (30.9) 
On en tire que 
PrLiG Le T =Priz + Prat. 


La perpendiculaire abaissée du vecteur x sur le sous-espace L: @ 
@ L, est égale à l’une des expressions (30.9). Si, en particulier, 
z L La, il vient 


OIL, D Le T = ortr, Z. (30.10) 


Exercices 


1. L'espace euclidien possède-t-il un analogue du théorème des trois per- 
pendiculaires ? 


2. Prouver que la somme de deux angles entre le vecteur f et les sous- 
espaces Ll et L+ est égale à x/2. 

. Chercher la perpendiculaire et la projection du vecteur / sur les sous- 
espaces triviaux. 


4. Montrer que si deux sous-espaces fixes L,, L, et tout vecteur x vérifient 
l'égalité 
PlpitLe = P'L z+ Prp, Tr 


la somme L, + L, cest vorthogonale. 
5. Montrer que si les sous-espaces L;, L., ..., L,, sont vorthogonaux 
deux à deux, alors pour tout vecteur x de Æ 


m 
zl2> S'Ipr, zx? 
IzF> > lprs, ze 


i= 1 
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$ 31. Isomorphisme euclidien 


Nous avons déjà constaté à plus d’une reprise la coïncidence de 
certaines propriétés d'un espace euclidien abstrait et des espaces des 
segments orientés. On aurait pu continuer à étendre à l’espace eucli- 
dien des faits et théorèmes de la géométrie élémentaire. Pourtant, on 
n’en a aucun besoin. 

Introduisons la notion d'isomorphisme euclidien. Nous dirons 
que deux espaces euclidiens Æ et ÆE” sont isomorphes s'ils le sont 
comme espaces vectoriels réels et si, de plus, on vérifie pour tout 
couple de vecteurs x, y de Æ, ainsi que pour des vecteurs correspon- 
dants x’, y de E”, l'égalité 


(x, y) = (x”, y'). 


Théorème 31.1. Pour que deux espaces euclidiens soient 
isomorphes, il faut et il suffit qu'ils aient la même dimension. 

Démonstration. Si deux espaces euclidiens Æ£ et E” 
sont isomorphes, ils le sont comme espaces vectoriels réels. Mais de 
tels espaces ont la même dimension. 

Considérons maintenant deux espaces euclidiens Æ et E” de 


même dimension z. Soient €, €, . . ., €, une base orthonormée 
dans E et eï, e;, ..., ex une base orthonormée dans £”. À chaque 
vecteur 


TZ = Qjey + Lolo + - +: + Ann 
de l’espace Æ faisons correspondre le vecteur 
z' = Qiei + Que, + ... + aner 
de l’espace E”. Comme nous l'avons montré plus haut, cette cor- 


respondance est un isomorphisme. Prenons maintenant un autre 
couple de vecteurs correspondant de E et de E”: 


y = Dies H Pres + ... +Pnen, 


y'= Biei+ Bei + -.. + nes. 
D'après (28.3), on a 


(x, y) = ais + fe +... + ann = (z”, y). 


Le théorème est démontré. 

Nous nous n’intéressons qu'aux propriétés des espaces vectoriels 
qui se déduisent des propriétés des opérations principales dont les 
espaces sont munis. De ce point de vue, les propriétés des espaces 
euclidiens isomorphes sont les mêmes. Il s'ensuit que tout théorème 
géométrique démontré dans l’espace V, sera valable également pour 
tout sous-espace tridimensionnel d’un espace euclidien. Certes, 
on peut prendre comme espace euclidien 7z-dimensionnel type l’es- 
pace arithmétique À, avec le produit scalaire introduit d’après 
(27.2). 
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Exercices 


1. Construire un isomorphisme euclidien entre les espaces V, et R:. 

2. Montrer que dans deux espaces euclidiens isomorphes, à tout système 
de vecteurs orthonormé correspond un système orthonormeé. 

3. Montrer que dans deux espaces euclidiens isomorphes, les angles entre 
les couples correspondants de vecteurs sont égaux. 

4. Montrer qu'un isomorphisme euclidien transforme la perpendiculaire 
et la projection respectivement en la perpendiculaire et la projection. 


:$ 32. Espace unitaire 


Nous avons étendu les notions géométriques essentielles aux 
seuls espaces vectoriels réels. Les résultats analogues ont lieu pour 
un espace vectoriel complexe. 

Un espace vectoriel complexe U est dit unitaire si à chaque couple 
de vecteurs zx, y de U on fait correspondre un nombre complexe 
(x, y) appelé produit scalaire et vérifiant les axiomes suivants: 


1. (x, y) = (y, 2), 
2. (Az, y) = À (x, y), 


3. (x+y, z)=(x, z)+ (y, 2), 
4. (x, z)>0 pour rz=0; (0, 0) =0 : 


quels que soient les vecteurs x, y, z de U et le nombre complexe À. 

La barre du premier axiome signifie le passage au nombre con- 
jugué complexe. Cette seule différence par rapport aux axiomes 
d’un espace euclidien n’entraîne aucune divergence profonde, mais 
il ne faut pas pour autant le perdre de vue. Ainsi, par exemple, si 
un espace euclidien donne lieu à l'égalité (z. Ày) = À (x, y), dans 
un espace unitaire on a (x, Ày) = À (x, y). 

Un espace unitaire U permet d'introduire certaines notions 
métriques. De même que dans le cas réel, on appelle longueur d’un 
vecteur la grandeur 


| TZ | — + (zx, r)!/2, 


Pour tout vecteur non nul la longueur est positive, la longueur du 
vecteur nul est nulle. Quel que soit À complexe, on vérifie la relation 


[Azf=lal-lzlf. 
L'inégalité de Cauchy-Bouniakovski 
[(z, y)P<(, x) (y, y) 


reste également valable. La démonstration est en principe la même 
que dans le cas réel. 
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Dans un espace unitaire on n’introduit pas en général la notion 
d’angle entre les vecteurs. On se borne au cas des vecteurs x et y 
orthogonaux en entendant par là, comme dans le cas réel, que 


(x, y) = 0. 


Il est évident que (y, x) = (z, y) = 0. 

Au fond, toute la théorie de l’espace euclidien décrite plus haut 
reste valable, sans modifier les définitions et les principes généraux 
des démonstrations, pour l’espace unitaire. 

A titre d’espace unitaire r7-dimensionnel type on peut prendre 
l’espace arithmétique C,, si pour deux vecteurs 


TZ — (@, Los + Œn); 
y = (PB, Ba, - - ., Pn) 


le produit scalaire est défini de la façon suivante: 
n 


(x, y) = 2 CAE | (32.1) 


On montre aisément sur cet exemple la signification de la con- 
jugaison complexe du premier axiome. Si le produit scalaire était 
introduit dans l’espace C,, d’après la formule (27.2), dans l’espace C;, 
par exemple, pour le vecteur 


z = (3, 4, 5i), 
on aurait 
(zx, x) = 9 + 16 + 25i° = 0, 


et le quatrième axiome important serait violé. 


Exercices 

1. Comparer l'espace euclidien À, et l'espace unitaire C;. 

2. Ecrire l'inégalité de Cauchy-Bouniakovski pour l'espace C,. 

3. L'inégalité de Cauchy-Bouniakovski peut-elle être observée dans un 
espace complexe si le produit scalaire y est introduit d’après les axiomes (27.1)? 

4. Une base orthogonale existe-t-elle dans un espace complexe si le produit 
scalaire y est introduit d'après les axiomes (27.1)? 


$ 33. Dépendance linéaire et systèmes orthonormés 


Nous avons déjà vu au $ 22 que l’indépendance linéaire d’un 
système de vecteurs de base peut être compromise par une faible 
modification des vecteurs eux-mêmes. Ce phénomène rend très 
difficile la résolution des problèmes pratiques en utilisant la notion 
de base. Toutefois il faut noter que les bases ne sont pas toutes à 
faire preuve d'une propriété aussi désagréable. En particulier, toute 
base orthonormée ne la possède pas. 
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$ 33.] 
, En une base orthonormée arbitraire dans un 


Soit €j, €+, . .. 
espace euclidien unitaire. Si la décomposition d’un vecteur b est 
n 
b=— > œie;, 
i= 1 


on a, d'après (28.4), 
F= À loup. (33.1) 
i=1 


Examinons à présent le système de vecteurs e, + &,, € + Ee, 
, En + En et supposons qu'il soit linéairement indépendant. 


Cela eue qu'il existe des nombres non ANwtAnement nuls f;, 
B., . . ., Ph tels que 

ñn 

2 Pi (es: + &:) —0 


On en tire 


| Q 
2 Pie: = — 2 LTÉE 
1—=1 1= 1 


En utilisant l'égalité (33.1) et l'inégalité (27.6), on obtient 


2 | Ba F=| > Pie: F=I à Pie: F<(2 [Blle:l)"< 
€ IPF) D le*). 


En comparant le premier et le second membre des relations obte- 
nues, on déduit que 
n 
2 [al >1. 
i=1 
Ainsi, l'inégalité obtenue signifie qu’en respectant les conditions 


2lelP<1, (33.2) 


le système de vecteurs 
Ey À Es ee À Eos + + En + En 
sera linéairement indépendant 
La propriété constatée des systèmes orthonormés a déterminé leur 
large application à la construction des algorithmes de calcul les plus 
différents associés à la décomposition suivant une base. 
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Exercices 


4. Soit e,, 62, - .- ., e, une base orthogonale d’un espace euclidien. Montrer 
que le système de vecteurs zx, ze, - .., Zn est linéairement indépendant si 


ñn 
1 
>. cos {e;, D}j>h—. 
i=1 
2. Soient les vecteurs x; = (x, Trio, + + ., zijn) Pour i=1,2,...,n 
donnés par leurs coordonnées dans une Éase arbitraire. Montrer que si 


Iril>r Dirt 
h+#:i 


pour tout i, le système 7,, r°, . .., x, est linéairement indépendant. 


CHAPITRE 4 


VOLUME D'UN SYSTÈME DE VECTEURS 
DANS UN ESPACE VECTORIEL 


$ 34. Produit vectoriel et mixte 


Cette fois encore notre étude débute par l’espace des segments 
orientés. Comme toujours nous supposons qu'il existe un certain 
système de coordonnées cartésiennes à origine en © et à base i, j, k. 

Trois vecteurs s'appellent triplet si on en indique le premier, le 
deuxième et le troisième. Pour noter un triplet on les écrit dans l’ordre 
de leur succession. 

Un triplet de vecteurs non coplanaires a, b, c est dit.à droite 
(resp. à gauche), la disposition des vecteurs s’établissant suivant la 
règle du tire-bouchon. 

Trois vecteurs non coplanaires quelconques a, b, c peuvent former 
six triplets 


abc, bca, cab, 
bac, acb, cba. 


Les trois premiers triplets sont de même orientation que le 
triplet abc, les autres étant de l'orientation opposée. Remarquons 
que si dans un triplet on permute deux vecteurs quelconques, l'orien- 
tation du triplet change. 

Un système de coordonnées affine ou cartésien est dit à droite 
(resp. à gauche) si les vecteurs de sa base forment un triplet à droite 
(resp. à gauche). Jusqu'à présent notre exposé ne dépendait pas de 
l'orientation de la base d’un système de coordonnées. Il en sera 
autrement dès ce moment. Pour fixer les idées, nous ne considérerons 
dans ce qui suit que des systèmes à droite. 

Soient a, b deux vecteurs non colinéaires. Faisons leur corres- 
pondre un troisième vecteur c vérifiant les conditions suivantes: 

1. le vecteur c est orthogonal à chacun des vecteurs a, b; 

2. le triplet abc est un triplet à droite; 

3. la longueur du vecteur c est égale à l’aire S d’un parallélo- 
gramme construit sur les vecteurs a, b localisés à une même origine. 
Si les vecteurs a, b sont colinéaires, associons à ce couple le vec- 
teur nul. , 
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La correspondance ainsi construite est une opération algébrique 


dans l’espace V.. On l'appelle multiplication vectorielle des vecteurs 
a, b et on la note 


c = {a, b]. 


Examinons les vecteurs de base à, j, k. D’après la définition du 
produit vectoriel, on a 


[ë, i] = 0, [é, Îl=k, [E, k|]= — j, 
[7, à] = — k, [J, j1=0, [j, k] = i, (34.1) 
Lk, i] = j, [k, Î1= — À, L#, k] = 0. 


Ces relations entrainent en particulier que la multiplication vec- 
torielle est une opération non commutative. 

Chaque triplet abc de vecteurs non coplanaires appliqués à un 
point commun © définit un parallélépipède. Le point © en est un 
sommet, les vecteurs a, b, c des arêtes. Désignons le volume de ce 
parallélépipède par le symbole V (a, b, c) en soulignant ainsi sa 
dépendance des vecteurs a, b, c. Si le triplet abc est coplanaire, 
admettons que le volume soit nul. Affectons maintenant au volume 
le signe « plus » si le triplet non coplanaire abc est orienté à droite, 
et le signe « moins » s'il est orienté à gauche. Appelons la nouvelle 
notion ainsi définie volume orienté d'un parallélépipède et notons-le 
V= (a, b, c). 

Un volume et un volume orienté peuvent être considérés comme 
des fonctions numériques de trois variables vectorielles qui prennent 
des valeurs réelles définies pour tout triplet abc. Un volume est 
toujours non négatif, alors qu’un volume orienté peut avoir n’im- 
porte quel signe. Nous allons voir que la distinction entre ces deux 
notions a un Certain sens. 

Soient a, b, c trois vecteurs arbitraires. Si l’on prend le produit 
vectoriel à droite de a par b, puis le produit scalaire du vecteur 
{a, b] par c, le nombre obtenu ([a, b], c) s'appelle produit mixte des 
vecteurs a, b, c. 

Théorème 34.1. Le produit mixte ([a, b], c) est égal au volume 
orienté du parallélépipède construit sur les vecteurs a, b, c rapportés 
à une origine commune. 

Démonstration. On peut admettre sans restreindre la 
généralité, que les vecteurs a, b, c sont non colinéaires car dans le 
cas contraire [a, b] — 0 et le théorème est immédiat. Soit S comme 


auparavant, l’aire du parallélogramme construit sur les vecteurs 
a, b. D'après (26.4), on a 


(fa, b], c)=]fa, b]| {prta, bc} = {Prta, b] C}- (34.2) 


Supposons que les vecteurs a, b, c soient non coplanaires. Alors 
{Prta» oc}, au signe près, vaut la hauteur k du parallélépipède cons- 
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truit sur les vecteurs a, b, c rapportés à une origine commune, sous 
la condition que sa base soit le parallélogramme construit sur les 
vecteurs a, b (fig. 34.1). Ainsi, le second membre de (34.2) est égal 


au signe près au volume du paral- 
lélépipède construit sur les vecteurs [a, ë] 
a, b, c. 

Evidemment, {prça. oc} = +hsi Nr HT 
les vecteurs [a, b] et c appartien- mr 
{Prta. oc} — —h. Si les vecteurs a, 2 
b,c sont coplanaires, c appartient 
au plan défini par les vecteurs a, b Fig. 34.1. 
et, donc, {Prfa, bC} = 0. Le théorè- 
me est démontré. 


nent au même côté du plan défini 
par les vecteurs a, b. Mais dans 

Corollaire. Trois vecteurs a, b, c quels qu'ils soient vérifient 
la relation 


ce cas le triplet abc est orienté 
à droite. Dans le cas contraire, 


(Ia, b], c)=(a, [b, cl). (34.3) 


En effet, la symétrie d’un produit scalaire entraîne (a, {b, cl) — 
= ([b, cl, a), c'est pourquoi il suffit de montrer que (la, b], c) — 
= ([b, cl, a). Mais cette dernière égalité est évidente du fait que 
les triplets abc et bca sont de même orientation et le parallélépipède 
qui leur correspond est le même. 

La relation (34.3) représente un moyen efficace d'analyse algé- 
brique. Nous allons montrer d’abord que quels que soient les vecteurs 
a, b, c et le nombre réel a, un produit vectoriel jouit des propriétés 
suivantes : 


1. [a, b] — —1b, a|, 

2. [aa, b] —ala, b], 

3. [a+b, c]={a, c]+1{b, c], 

4. [a, a] —=0. 168 3 


La propriété 4 est immédiate d’après la définition. Pour démon- 
trer les autres propriétés, nous utiliserons le fait que les vecteurs x 
et y sont égaux entre eux si et seulement si 


(x, d) = (y, d) 
pour tout vecteur d. 

Soit d'un vecteur arbitraire. Les triplets abd et bad sont d'’orien- 
tation opposée. En vertu du théorème (34.1) et des propriétés d’un 
produit scalaire, on a 

(La, b], d) CE —((b, a], d) + (—(b, a], à). 
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Puisque d est un vecteur arbitraire, cela signifie que la, b] — —[b, a] 
et la première propriété est démontrée. 

Pour prouver la deuxième et la troisième propriété, procédons 
d'une façon, analogue mais en tenant compte de la relation (34.3). 
On a 


([æa, b], d)—(aa, [b, dj) =a(a, [b, dj) — 
=a([a, b], d)=(æla, b], d), 
ce qui justifie la propriété 2. Ensuite 
(la+b, c], d)=(a+b, [c, d)]=(a, [c, d]) + 
+ (b, [c, dj)=(la, c], d)+ (1, c], d)=(le, c]+1b, c], dj); 
la propriété 3 est donc également vraie. Pour le deuxième facteur 
on a des relations analogues: 
la, ab] — —[ab, a] — —a [b, a] — a [a, b], 
{a, b+ cl = —[b + c, al — —[b, al —[c, al = (a, b] + [a, cl. 
Maintenant nous pouvons discuter des propriétés d'un volume 


orienté en tant que fonction du triplet de vecteurs. Soit, par exemple, 
le vecteur a, combinaison linéaire de certains vecteurs a”, a”. Alors 


([æa’ + Pa”, b], c)—=(ala’, b]+Bl{a”, b], c)= 
—=@({[a", b], c+B([a”, b], c). 


Par conséquent, 
VE (œa'+ fa”, b, c)—=aV* (a, b, c)+ BV (a”, b, c) 


quels que soient les vecteurs a”, a” et les nombres réels a, f. 

Lorsqu'on permute deux arguments d'un volume orienté, celui-ci 
ne change que de signe; il s'ensuit qu’une égalité analogue à la 
précédente a lieu pour chaque variable indépendante. Ces égalités 
expriment le fait que le volume orienté est une fonction linéaire 
par rapport à chaque variable indépendante. 

Si les vecteurs a, b, c sont linéairement dépendants, ils sont 
coplanaires ; le volume orienté est alors nul. Ensuite, compte tenu 
des relations (34.1), on trouve que 


VE (i, j, k)=(li, ji], k)=(k, k)=1. 


Ainsi, nous pouvons conclure qu’en tant que fonction un volume 
orienté jouit des propriétés suivantes: 


A) c'est une fonction linéaire par rapport 
à chaque variable indépendante ; 

B) il est nul pour tous les systèmes linéaire- (34.4) 
ment dépendants; 

C) il est égal à l’unité au moins pour un sys- 
tèeme de vecteurs orthonormé. 
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Nous n’avons pas énoncé, certes, toutes les propriétés d'un volume 
orienté, loin de là. Les propriétés (34.4), ainsi que d’autres pro- 
priétés peuvent être établies aisément si l’on connaît l’expression 
explicite des produits vectoriel et mixte par les coordonnées des 
vecteurs a, b, c. 

Théorème 34.2. Si les vecteurs a, b sont donnés par leurs 
coordonnées cartésiennes 


a = (Zys Ya, 2); 
b — (ze, Y2, 22), 
les coordonnées de leur produit vectoriel sont 
[a, D] — (yaZ2 — Yañis Z1T2 — 221, Tiÿa — Tai). (34.5) 


Démonstration. En tenant compte du fait que les coor- 
données des vecteurs définissent les décompositions 


a = Tai + Yi + 14, 
b = zoi + Yoj + 22h, 


et en s'appuyant sur les propriétés algébriques d’un produit vec- 
toriel, on trouve 


(a, b] = Zita li, ë] + ay li, j) + zazo li, k] + 
+ Yate ls à) + Yaye j, Ï1 + Yaze lj, k] + 
+ Z1te Ük, à] + ziye Ük, j) + 2129 (x, k]. 


Le théorème se déduit maintenant des relations (34.1). 
Corollaire. Si le vecteur c est donné aussi par les coordonnées 
Las Yss Za dans le même système cartésien, il vient 


([a, d], c)= Ziÿezs + ToYs21 + TaWi2o — ZiVs2o — LoYi23 — ZaÿoZs. (34.6) 


L'introduction d'un volume orienté et l'étude de ses propriétés 
algébriques permettent de faire des conclusions importantes sur la 
longueur, l’aire et le volume. 

Remarquons que les bases orientées à droite et à gauche définis- 
sent le partage de toutes les bases de l’espace en deux classes. Le 
terme « à droite » et « à gauche » n’a pas de sens profond et n'est 
dû qu’à un procédé commode pour identifier la classe de telle ou 
telle base. Au fond, c’est à ces deux classes qu'est lié le concept de 
volume oriente. 

Nous avons déjà eu à étudier des faits de ce genre. Toutes les 
bases d’une droite peuvent être partagées en deux classes si on as- 
socie en une classe les vecteurs de même orientation. Il s'avère de 
plus que la mesure algébrique d’un segment orienté est un analogue 
parfait d’un volume orienté, si ces deux notions sont envisagées 
comme des fonctions d’un système de vecteurs. La propriété A a 


S* 
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lieu d’après les relations (9.8). La propriété B est vraie du fait que 
la mesure d’un segment nul est nulle. La propriété C est évidente. 

Nous aurions pu réaliser une étude analogue indépendante pour 
le cas d’un plan. Il est pourtant plus simple de faire appel à des 
résultats déjà obtenus. Fixons un système de coordonnées cartésien 
Oxy. Complétons-le jusqu’à un système de coordonnées orienté à 
droite Oxyz de l’espace. Portons notre attention sur le fait que l’une 
des orientations possibles de l’axe Oz est définie par la disposition 
des axes Ox et Oy. Ceci définit encore un partage de l’ensemble des 
bases d’un plan en deux classes. L’aire orientée S+ (a, b) du paral- 
lélogramme construit sur deux vecteurs a, b du plan Oxy peut être 
définie, par exemple, par l'égalité S+ (a, b) = V+ (a, b, k). Bien 
sûr, cette fois encore, les propriétés À, B, C sont respectées. 

Ainsi, en effectant aux longueurs, surfaces et volumes certains 
signes et en considérant ces notions comme des fonctions des sys- 
tèmes de vecteurs, on peut obtenir que toutes ces fonctions aient les 
mêmes propriétés algébriques A, B, C de (34.4). 


Exercices 


1. Montrer que les vecteurs a, b, c sont coplanaires si et seulement si leur 
produit mixte est nul. 
2. Montrer que trois vecteurs a, b, c quels qu'ils soient vérifient la relation 
[a, [b, c]] —— (a, c) b — (a, b) c. 


3. Montrer que la multiplication vectorielle n’est pas une opération asso- 


ciative. 
. 4. Trouver l'expression de l’aire orientée d’un parallélogramme à l'aide 


des coordonnées cartésiennes des vecteurs sur un plan. 
5. Les formules (34.5) et (34.6) changeraient-elles si le système de coor- 
données par rapport auquel sont donnés les vecteurs était orienté à gauche? 


$ 35. Volume et volume orienté 
des systèmes de vecteurs 


Dans les espaces vectoriels des segments orientés, l'aire et le 
volume sont des notions dérivées de la longueur d’un segment. 
Nous avons déjà étendu la notion de longueur à l’espace euclidien 
abstrait. Examinons maintenant un problème analogue relatif à 
l’aire et au volume. 

Soient x, et x. deux vecteurs non colinéaires sur un plan. Cons- 
truisons' sur ces vecteurs un parallélogramme en prenant comme 
base le vecteur zx. (fig. 35.1). Abaïissons de l’extrémité du vecteur x; 
sur la base une perpendiculaire h. L’aire S (x, x) du parallélogram- 
me sera définie par la formule 


S (tn ze) = [Il I. (35.1) 
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Désignons par L, le sous-espace nul, par L; l'enveloppe linéaire 
du vecteur xz.. Puisque 


[r,|=|ortz,z: lé 


Ja formule (35.1) peut s’écrire 
S'(zs, ze) = lortz Till oït rite |. (59.2) 
Choisissons ensuite trois vecteurs non coplanaires Z1, Ze, Z: 


de l’espace. Construisons sur ces vecteurs un parallélépipède en 
prenant pour base le parallélogramme engendré par les vecteurs 


A7 ÉP 


Fig. 35.1. Fig. 35.2, 


Z1s Ta (fig. 35.2). Abaissons de l'extrémité du vecteur x, sur la base 
une perpendiculaire k.,. Le volume V (x1, x, x:) du parallélépipède 
sera défini par la formule 


V (ti Zoe, 23) = S (tx, Ze) | ha |. 


Si l’enveloppe linéaire des vecteurs 21, ze, zA est notée L:, alors 
d’après (35.2), on a 


V'(zu Ze, 23) = |ortr ZllortrsTe||ortz, z |. 


Ainsi, dans les espaces vectoriels V,, V, et V:, la longueur d'un 
vecteur, l’aire d’un parallélogramme et le volume d’un parallélé- 
pipède s'expriment par des formules qui trahissent une certaine loi: 


Irl=lortz |, 
S (Zi Ze) = |ortroTi||Ortrs Ze |, (35.3) 
V'(xss 2e, 2) = lortr, mi|lortrstellortz ts |. 


En particulier, le nombre de facteurs coïncide partout avec la di- 
mension de l’espace. 

Ces formules suggèrent comment il faut introduire la notion de 
volume dans un espace euclidien de dimension n. Soit Z1, Ze, . . ., Tn 
un système arbitraire de vecteurs dans Æ,. Notons L, le sous-espace 
nul; L; l'enveloppe linéaire des vecteurs z1, . .., x;. Alors, par 
analogie avec les espaces des segments orientés, nous dirons que le 
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volume V (zy, Ze, - - ., Th) d'un système de vecteurs zy, za, . . ., æn 
de l’espace euclidien £, est la valeur sur ce système de la fonction 
réelle de nr variables vectorielles de ÆE, qui est définie par l'égalité 


n- 1 


V (z., Lo, ce. Æ;) = Il | orlz, Li+: |. (35.4) 


Certes, pour le moment on ne peut pas affirmer que le volume 
d'un système de vecteurs jouit pour tout z des propriétés propres 
précisément au volume. Mais pour les espaces euclidiens de dimen- 
sion À, 2, 3 il possède, grâce à l’isomorphisme euclidien et aux rela- 
tions (35.3), respectivement les mêmes propriétés que la longueur 
d’un segment, l’aire d’un parallélogramme et le volume d’un paral- 
lélépi pède. 

Essayons maintenant d'envisager le volume d'un système de 
vecteurs de l’espace euclidien Æ£, d’un autre point de vue. Nous avons 
déjà constaté qu'en affectant des signes définis à la longueur, à l’aire 
et au volume, on les transforme en fonctions algébriques munies de 
certaines propriétés générales. On est donc autorisé à penser que 
dans un espace euclidien arbitraire il existe une analogie corres- 
pondante. Ceci dit, nous donnerons la définition suivante. 


On appelle volume orienté V=+ (x, z:, . . ., z,) d'un système de 
vecteurs Zi, Ta, + - .» Zn de l’espace euclidien Æ, la valeur sur ce 


système d'une fonction réelle de x variables vectorielles de E, 
qui possède les propriétés (34.4). 

Cette définition est également assez confuse. Nous ne savons pas 
si, pour nr > 4, il existe dans un espace euclidien un volume orienté 
pour tout système de vecteurs. Mais même s'il existe, sa définition 
par les propriétés (34.4) est-elle univoque? Et, enfin, quelle est la 
liaison dans le cas général entre un volume et un volume orienté? 
Pour le moment nous ne pouvons répondre qu’à la dernière question 
et encore, seulement dans les cas de nr — 1, 2, 3 

Nous aurons parfois à examiner un volume et un volume orienté 
dans l’espace E, pour des systèmes qui comptent moins de r vecteurs. 
Cela traduira le fait qu'il s’agit non pas de l’espace tout entier, 
mais d’un de ses sous-espaces dont on tire le système donné. En se 
conformant à ce qui précède, les propriétés (34.4) ne seront étudiées 
que pour les vecteurs de ce même sous-espace. On pourrait avoir 
besoin de considérer le volume et le volume orienté d’un système 
de plus que nr vecteurs. D’après la formule (35.4) et la propriété B 
de (34.4) dans de tels systèmes les deux fonctions doivent être nulles. 

Constatons à titre de conclusion que l’utilisation des deux notions 
différentes associées au volume permettra de perfectionner consi- 
dérablement leur étude, étant donné qu'une de ces notions reflète 
l’aspect géométrique du problème, et l’autre l’aspect algébrique. 
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Nous découvrirons rapidement une liaison intime entre elles et de 
plus, le fait qu’elles sont à la base d’une méthode de calcul, dont 
l'intérêt dépasse le cadre du problème du volume. 


Exercices 


1. Montrer que dans les espaces de segments orientés la longueur, l'aire 
et le volume orienté sont définis d’une façon univoque par les conditions (34.4). 

2. Ces mêmes notions, seraient-elles définies d'une façon univoque si on 
élimine l'une des conditions (34.4)? 

3. Montrer que dans tout espace euclidien V (r,, re) — | zr,|| 7.1 si et 
seulement si les vecteurs r, et r, sont orthogonaux. 

4. Montrer que dans tout espace euclidien V (r,, re) — V (r, x). 


$S 36. Propriétés géométriques 
et algébriques d’un volume 


Nous commencerons l'étude de la notion de volume dans un espace 
euclidien E, par les propriétés géométriques et algébriques qui se 
déduisent de la définition. 

Propriété 1. Toujours V'(xzy,Te,..., In) > 0. L'égalité 
V (Z1,Zas..rTn) = 0 à lieu si et seulement si le système de vecteurs 
Lis Lay + - +» Zn st linéairement dépendant. 

La première partie de la proposition est immédiate d'après 
(35.4) et la démonstration ne doit porter que sur la deuxième partie. 
Soit Ty, Tes + : - Tn un système linéairement dépendant. Si x, = 0, 
le volume est nul par définition. Mais si x; 0, un certain vecteur 
Zr+1 S'exprime linéairement par les vecteurs précédents x, . . ., ze. 
Alors, ortry, Zx+1 — 0, et cette fois encore le volume est nul. 

Supposons maintenant que le volume soit nul. D’après la dé- 
finition cela signifie qu’un des facteurs du second membre de (35.4) 
est nul. Soit, pour ce facteur, i — k. Si k — 0, alors x, — 0. Mais 
si 4-0, la condition ortz, zx+1 —= 0 signifie que le vecteur z:;;, 
appartient à l’enveloppe linéaire des vecteurs z1, . . ., zk, c'est-à- 
dire que lesystèmezx:, . . ., z:+1est linéairement dépendant.Dans les 
deux cas le système de vecteurs x, Z2, - . ., æ, tout entier sera lui 
aussi linéairement dépendant. 

Propriété 2. Tout système de vecteurs x1, z2, . - ., ï, vérifie 
l'inégalité d'Hadamard 


n-1{ 
ACTE SC Tn) [za (36.1) 


l’égalilé ayant lieu si et seulement si le système x, z:, . . ., xh est 
orthogonal, ou bien contient le vecteur nul. 
D'après les propriétés d’une perpendiculaire on a l'inégalité 


forts, Tis|<ITitl; (36.2) 
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elle se transforme en égalité si et seulement si z;+1 L L; ou, ce qui 
revient au même, si le vecteur zx;;, est orthogonal aux vecteurs 
Ti Les + + «+, Zi. Considérons le produit des premiers membres des 
inégalités de la forme (36.2) pour tout à ainsi que celui de leurs 
seconds membres. On a: 
n—{ 
i 


n— 1 
[L | OrlL, Tir < [] [Ti+s |. 
= = 


Si les vecteurs du système z1, Ze, . . ., Z, sont non tous nuls, cette 
inégalité se transforme en égalité si et seulement si le système est 
orthogonal. Le cas du vecteur nul est trivial. 

L'inégalité d’Hadamard entraîne quelques corollaires utiles. 
Supposons que le système Z1, Ze, . « ., Z, Soit normé; il est évident 
alors que 


V (Z2 Toy Tn) < 1. 


La proposition suivante est également vraie. Si le système z1, z2, . . . 

- + Zn St normé et son volume vaut l'unité, il est orthonormé. 

Puisque le volume de tout système normé ne dépasse pas l'unité, 

cela signifie que parmi tous les systèmes normés, le volume d'un 
système orthonormé est maximal. 

Propriété 3. Deux ensembles orthogonaux de vecteurs 

Lis Los + + +9 Tp Et Yrs Vos + + ., y, quels qu'ils soient vérifient l'égalité 


L4 (Z1 Toy + + +9 Tps is Yes Ur) —— 
=V (Zi Les Tp) V(Y1s Yes + +. Ur). 


Désignons par L; l'enveloppe linéaire des premiers à vecteurs du 


système réuni Z1, . : ., Tps Yis + + Ur, Par K, l’enveloppe linéaire 
des vecteurs y1, . . ., yr. Par hypothèse, chaque vecteur du système 
Yus + - -,Y- est orthogonal à tous les vecteurs du système x:, . . ., zh. 
Donc 

Lp+t =L; (a) K; 


pour tout ? de O à r. Maintenant, en tenant compte de l'égalité 
(30.10), on a 


V (x, ..) Th; UTE ...: Yr) = 


p-1 T—1 
— (IL [ortz, Ti | ) (I | or. Ut+1 |) — 


P—1 r— 1 
= ([] lortr, Ti |) ( [] lortxe, Vis |) 27 
1=0 t=0 


—V (x, ..., Th) V (Ys ..) Ur). 
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Avant de poursuivre nos recherches, faisons une remarque. Le 
volume d'un système s'exprime seulement par les perpendiculaires 
aux enveloppes linéaires des vecteurs précédents. Vu les propriétés 
des perpendiculaires on peut déduire que le volume d'un système 
pe change pas si on ajoute à tout vecteur une combinaison linéaire 
quelconque des vecteurs précédents. En particulier, le volume ne 
change pas si un vecteur est remplacé par la perpendiculaire abaissée 
de ce vecteur sur une enveloppe linéaire quelconque des vecteurs 
précédents. 

Propriété 4. Le volume d'un système de vecteurs ne change 
pas quelle que soit la permutation des vecteurs du système. 

Considérons d’abord le cas d’un système de vecteurs x1, . . ., zh 
où l’on permute deux vecteurs voisins Zp+1 et Zp+2. D'après la 
remarque ci-dessus, le volume ne change pas si nous remplaçons les 
vecteurs Zp+1, Tp+2 Par les vecteurs ortr, Zp+1s Ortrp Zp+e et les 


VeCteUrsS Zp+3s + + -» En Par les vecteurs Ortr,,: Tp+3s + + -» OTtLpus Tn- 
Ceci fait, trois ensembles de vecteurs 
Li ses D 


OrtzpTp+i- OFLp Tp+2s 
OrtL, +: Tp+3r - es OTlLp4e Th 

sont orthogonaux deux à deux, et en vertu de la propriété 3 on a 
Vs 545 sie Tiens Di) =V Gi, 5: Tp)X 

X V(ortzTp+1s OftLpTp+a)°V (OTTL,e Tp43s +, OTtLpsr Tu). 
Il est clair que les enveloppes linéaires des vecteurs x, . .., 7», 
Tp+1s Tp+a Ct Ts + + +» Tps Tp+es Tp+1 COINCident ; donc 
V (x, es Lp+9s Tp+is =.) Zn) = V (x, ed Tp) X 

X V(ortz,Tpre, Ortzp Zp+1)°V (OF lLp4e Tp+3, -.., OEtL,4: Tu). 

En vertu de l’isomorphisme euclidien, le volume d’un système 

de deux vecteurs possède les mêmes propriétés que l’aire d’un paral- 
lélogramme. En particulier, il ne dépend pas de l’ordre des vecteurs 


du système. En comparant les seconds membres de deux dernières 
égalités, on en tire maintenant que 


V (21 + es Tp+1s Tp+2s : - 9 Tn) = ÿ (1 es Tp+2s Lp+1s + + Th). 


Un peu plus loin nous montrerons que toute permutation x;,, 
Lies + + - Ti des Vecteurs du système z1, Z2, - - ., T, peut s’obtenir 
par permutations consécutives de vecteurs voisins. C’est pourquoi 
pour une permutation arbitraire la propriété 4 se déduit du cas 
particulier qui vient d’être examiné. 
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Propriété so. Le volume d'un système de vecteurs est une 
fonction absolument homogène, c'est-à-dire 


PS: dr, css) = lei at 3:54) 


pour tout p. 
D'après la propriété 4, nous ne porterons pas atteinte à la géné- 
ralité en posant p = nr. Mais alors, en tenant compte de (30.6), 


n°! 
Vi ee Zn tn) =(Ï] lorts, al) forts (axe) |= 
1=- 


n- 1 
=|c| [I lortz,z,, .|=1@lV (x, es Tn-4r Zn): 
1=0 


Propriété 6. Le volume d'un système de vecteurs ne change 
pas si on ajoute à l’un quelconque des vecteurs du système une combi- 
naison linéaire des autres vecteurs. 

De nouveau, d'après la propriété 4, nous pouvons admettre 
qu'on ajoute au dernier vecteur une combinaison linéaire des vecteurs 
précédents. Mais comme nous l'avons déjà constaté, dans ce cas le 
volume ne change pas. 

Le volume d'un système de vecteurs est une fonction réelle. 
Cette fonction possède certaines propriétés que nous avons déjà 
établies en partie. Elles ont confirmé notre hypothèse que le volume 
d’un système de vecteurs d’un espace euclidien que nous avons dé- 
fini, possède précisément quel que soit z toutes les propriétés propres 
au volume. Mais ce qui importe peut-être bien plus, c’est que les 
propriétés établies définissent le volume d’une façon univoque. Plus 
précisément, on a le 

Théorème 36.1. Si une fonction réelle F (x, ze, . . ., Zn) 
de n variables vectorielles de E, possède les propriétés suivantes : 


A) ne change pas après l'addition à n'importe) 
quelle variable indépendante d'une combinaison liné- 
aire quelconque des autres variables; 

B) est absolument homogène; 

C) est égale à l'unité pour tous les systèmes ortho- 
normés, alors elle coïncide avec le vnlume du système 
de vecteurs Zj, Las + + + Zne 


(36.3.) 


ND =——— om 


Démonstration. Si parmi les variables indépendantes 
Lis + + + Th il Y en a au moinsune qui est nulle, alors, d’après la pro- 
priété B, 


Fit sr) = VO Ts 5m) = 0: (36.4) 


Supposons maintenant que le système z1, z2, - . ., 3, Soit arbitraire. 
En retranchant de chaque vecteur x; sa projection sur le sous-espace 
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engendré par les vecteurs 21, . .., z;_1 et en tenant compte de la 
propriété À, on voit que 


F(xy, Les c.., Zn) = F(ortroTy, OftziTe, -.., Ortpn Zn). (36.5) 


Si le système z1, Z2, . . ., z, est linéairement dépendant parmi 
les vecteurs ortz;., zx; il Y a au moins un vecteur nul et l'égalité 
(36.4) a encore lieu. Supposons que le système zx, Z2, . . ., Zn Soit 
linéairement indépendant, alors, les vecteurs du système 


OrtLo Tir OFlLyTos +. OTLn-1 Tn 


sont non nuls. Ce système étant orthogonal, il existe un système 
orthonormé e, €, .- . ., e, tel que 


z; —|ortz. zx; ei. 


ortr. i! 


i— 1 
D'après la propriété C, on a 
Fe es 555 6) =1: 


C'est pourquoi la propriété B entraîne que 


ni 
F(TS Les ses, zn)= (I [ortz, ris | ) Fe, €2, ..., en) = 


Ve LL: 2). 


Le théorème démontré permet d'’affirmer que si nous construisons 
d'une façon quelconque une fonction aux propriétés (36.3), cette 
fonction sera précisément le volume d’un système de vecteurs. 


Exercices 


1. Donner une interprétation géométrique des propriétés 2, 3, 6 dans les 
espaces des segments orientés. 

2. Donner une interprétation géométrique de l'égalité (36.5) dans les 
espaces des segments orientés. 

3. La fonction qui vérifie les conditions (36.3) peut-elle être égale à zéro 
sur queue système de vecteurs linéairement indépendant ? 

. Soit un due de vecteurs qui possède par rapport à une base crtho- 

norme CANAFE n la propriété 


(rs, e;) = 0 
pour i — 2, 3, ,nej<ii=1, 2,...,.n —1 et j >i). Chercher 
l'expression du volume Vire, 7n) par Îles coordonnées des vecteurs 
Tis Pas se: Tn dans la base e;, Esr 


5. Qu'est-ce qui va changer si on SphHiaue la notion de volume à un espace 
complexe ? 
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$ 37. Propriétés algébriques d’un volume orienté 


LL] 


Passons maintenant à l’étude des propriétés algébriques d’un 
volume orienté en abandonnant pour le moment la question de son 
existence. Posons à la base de la discussion les conditions A, B, C 
de (34.4). 

Propriété 1. Si deux vecteurs quelconques d'un système de 
vecteurs coincident, le volume orienté du système est nul. 

Cette propriété est une conséquence directe de la condition B. 
On prouve sans peine que sous la condition À, la condition B et la 
propriété 1 sont équivalentes. 

Propriété 2. Si on permute deux vecteurs quelconques d'un 
système de vecteurs, le volume orienté du système change de signe. 

La démonstration est la même pour n'importe quels vecteurs, 
aussi, pour simplifier l'écriture, nous nous bornons au cas de la 
permutation du premier et du deuxième vecteurs. D’après la pro- 
priété 1, 

V- (Zi + Te: TT Le, Las Th) = 0. 
Par ailleurs, d’après la condition A, 
V< (x +, Ti Tor Las... Zn) = V* (Zi, Lis Las +, Zn) + 
VF (Es a Li, ME 
VS (ri, Los Las ce En) VE (tes Lis Las co. Tn). 


Dans le second membre de cette égalité, les deux premiers termes 
sont nuls, d'où la propriété 2. Là encore on montre facilement que 
sous la condition À, la condition B et la propriété 2 sont équivalentes. 

Propriété 3. Le volume orienté d'un système de vecteurs ne 
change pas si l’on ajoute à l'un quelconque des vecteurs l'une quelconque 
des combinaisons linéaires des autres vecteurs. 

Pour simplifier examinons cette fois encore le premier vecteur. 
On a en vertu de la condition A 


v* (x, + 2 Œylilos -.., In)=V* (xs, Los Zn) + 
1=2 


+ à ŒiV (Lis das ss En). 
i=2 


Dans cette égalité, d’après la propriété 1, tous les termes du second 
membre sauf le premier sont nuls. 
Propriété 4. Un volume orienté est une fonction homogène, 
c'est-à-dire 
+ + 
V (z:, ... AT p; ... Tn) = AV (xs, 3 Th; ...) Tn) 


pour tout p. 
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Cette propriété est immédiate d’après la condition A. 

Propriété 5. L'égalité V£ (x, xs, ..., x,) = 0 a lieu si 
et seulement si le système de vecteurs x, z:, . . ., x, est linéairement 
dépendant. 

Il est clair qu’il faut démontrer seulement que l'égalité 
VE (x, Za, +. ., Zn) = 0 entraîne la dépendance linéaire des vec- 
teurs Ty, Lo, + . ., Zn. Raisonnons par l’absurde. Soit y, Yo, . . ., Un 
un système linéairement indépendant de volume orienté nul. Ce 
système est une base dans £,, aussi a-t-on pour tout vecteur z de Æ, 


2 = Qiÿs + oo + . . . + Ann. 


Remplaçons maintenant dans le système y,, y, ..., y, un 
vecteur quelconque, par exemple y,, par le vecteur z. En utilisant 
de proche en proche les propriétés 3 et 4, on amène 


n 
VE (2, Va ee, Un) = VE (a+ D œyr, Ve, -.., Vn) = 
= VE (@;ys, Yas ---) Yn) = XV * (y1, Y2s ce. Yn) = 0. 


D’après la définition, un volume orienté est non nul au moins 
sur un système linéairement indépendant 2,, z:, ..., z,. Mais en 
remplaçant tour à tour les vecteurs y,, Ye, . . ., YA par les vecteurs 
Zjs 305 + + + Zn ON Obtient, d’après le théorème 15.2, que sur ce système 
aussi un volume orienté est égal à zéro. Cette contradiction prouve 
la propriété considérée. 

Propriété 6. Si deux volumes orientés coincident au moins 
sur un système de vecteurs linéairement indépendants, ils coincident 
identiquement. 

Supposons que l’on sache que les volumes orientés V# (x,, ze, . .. 
... Zn) et VE (x, 22, . . ., Th) coïncident sur le système linéaire- 
ment indépendant 2,, Z:, ..., Zz,. Considérons la différence 
Fr rs sa) = VE Gi ss 0) = Ve Gi D, ::5,2) 
Cette fonction satisfait aux propriétés 3 et 4 d’un volume orienté. 
En outre, elle est nulle sur tous les systèmes linéairement dépendants 
et au moins sur un système linéairement indépendant 2,, Z2, . . ., 2h. 
En reprenant les raisonnements de la démonstration de la propriété 5, 
nous en tirons la conclusion que F (x,, z:, . . ., z,) s'annule sur tous 
les systèmes linéairement indépendants, c’est-à-dire qu'elle est 
identiquement nulle. 

La propriété 6 entraîne que si l’on fixe celui des systèmes ortho- 
normés sur lequel un volume orienté doit être égal à l’unité, la 
définition de ce volume par les conditions (34.4) est univoque. 

Propriété 7. Le module du volume orienté d’un système 
de vecteurs coïncide avec le volume de ce même système. 
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Soit un volume orienté égal à l’unité sur le système orthonormé 
Zjs 205 + + + 2n. EXaminons les fonctions | V£ (x,, x, . . ., x,) | et 
V (Zi Les + + +, Zn). Elles satisfont toutesfles‘ deux aux conditions A.B 
de (36.3) et coïncident sur le système linéairement indépendant 
Zi 20 + + + Zn. La fonction 


DZ, 2:25, 2n)= || VE (x, Las ces Tn)|—V(ti, Los -.., Th) 


vérifie également les conditions À, B de (36.3), elle est nulle sur 
tous les systèmes linéairement dépendants et au moins sur un système 
linéairement indépendant z,, z:, . .., z,. En reprenant encore les 
raisonnements de la démonstration de la propriété 5, nous en tirons 
la conclusion que ® (zx;, z:, . . ., r,) est identiquement nulle. 

Cette dernière propriété est très importante, car elle permet 
d’affirmer que le module d’un volume orienté doit posséder toutes 
les propriétés d’un volume. En particulier, il doit être égal en valeur 
absolue à l'unité sur tous les systèmes orthonormés et non pas seule- 
ment sur l’un de tels systèmes. Ce module vérifie l’inégalité d’Hada- 
mard, etc. La propriété décrite donne une réponse définitive à toutes 
les questions que nous avons posées sur le volume et le volume 
orienté. La seule chose qui nous manque, c’est la démonstration de 
l'existence d’un volume orienté. 


Exercices 


1. Montrer que sous la condition A de (34.4), la condition B est équivalente 
à la propriété 1 et à la propriété 2. 
| 2. Montrer que, quel que soit le nombre réel «, il existe un système de 
vecteurs dont le volume orienté est égal à «. 

3. Supposons que la condition C de (34.4) soit remplacée par la condition 
d'égalité à tout nombre fixé sur n'importe quel système linéairement indépen- 
dant fixé. Comment le volume orienté changera-t-il? 

4. Pour décrire les propriétés d’un volume orienté a-t-on utilisé l'existence 
d'un produit scalaire dans l’espace vectoriel et le caractère réel du volume 
orienté? Qu'est-ce qui va changer si nous examinons un volume orienté dans 
un espace complexe ? 


$S 38. Permutations 


Considérons un système z;, Z+, ..., 2, et un autre système 
Lis Tjos + + +1 Tin AUi S’obtient en permutant les vecteurs d’une façon 
quelconque. Supposons que ces systèmes puissent être transformées 
l’un en l’autre par des permutations successives dont chacune échange 
deux éléments. Les volumes de tels systèmes seront les mêmes, alors 
que leurs volumes orientés seront soit les mêmes, soit différents par 
le signe selon le nombre de permutations à faire. 

Dans les questions relatives aux permutations les propriétés in- 
dividuelles des vecteurs ne jouent aucun rôle, alors que leur ordre 
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est déterminant. Aussi, allons-nous envisager non pas les vecteurs 
eux-mêmes, mais leurs numéros 1, 2,...,n. La collection de nombres 


Jus Je + + +» Jns 


parmi lesquels il n’y a pas d’égaux et dont chacun est un des nombres 
1,2,...,n, s'appelle permutation de ces nombres. La permutation 
4, 2,..., n est dite normale. 

On montre aisément que dans un ensemble de n Done la quan- 
tité totale des permutations de toutes sortes est n!. En effet. pour 
n — 1 cela est évident. Supposons que la proposition soit vraie pour 
tout ensemble de 7 — 1 nombres. Toutes les permutations de nr 
nombres peuvent être partagées en 7 classes, chaque classe contenant 
les permutations qui commencent par le même nombre. La quantité 
des permutations dans chaque classe coïncide avec celle de permu- 
tations de z — 1 nombres, c’est-à-dire il vaut (n — 1)!. Par consé- 
quent, la quantité de toutes les permutations de r nombres est n!. 

On dit que dans une permutation les éléments i, j présentent une 
inversion si i > j, i précédant j dans la permutation. Une permutation 
est dite paire si le nombre de ses inversions est pair, et impaire 
dans le cas contraire. Si dans une permutation nous échangeons deux 
nombres pas forcément voisins, en laissant tous les autres nombres 
invariants, nous obtenons une autre permutätion. Cette transfor- 
mation s'appelle transposition. 

Montrons que toute transposition change la parité d’une permu- 
tation. Pour les nombres voisins, cette proposition est évidente. 
Leur position par rapport aux autres nombres reste la même, alors 
que la permutation de ces nombres voisins change d’une unité la 
quantité totale d’inversions. 

Supposons maintenant que, entre les nombres à et j à transposer, 
il y ait s autres nombres X,, k:, . . ., k,, c’est-à-dire que la permuta- 
tion soit de la forme 


Li kik ka ie.. 


Echangeons successivement le nombre à avec les nombres voisins 
ki, Koy : - +, ke, j. Puis déplaçons le nombre j, mis déjà devant à, à 
gauche à l’aide de s transpositions avec les nombres k,, Æs+1, . . .. Ka. 
Nous réaliserons ainsi en tout 2s + 1 transpositions des nombres 
voisins. La parité de la permutation va donc changer. 

Théorème 38.1. Les n!l permutations de n nombres peuvent 
étre ordonnées de manière que toute permutation s'obtienne par une 
transposition de celle qui la précède, en commençant par n'importe 
quelle _Permuliation. 

Démonstration. Cette proposition est vra e pour rz = 2. 
En effet, s’il faut commencer par la permutation 1, 2, l'ordre cherché 
est 1, 2. 2, 1; si, par contre, nous commençons par 2, 1, l’ordre en 
question sera 2, 4, 1, 2. 
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Supposons que le théorème soit démontré pour toute permutation 
possédant au plus z — 1 nombres. Considérons les permutations de 
n nombres. Supposons que nous devions commencer par la permu- 
tation é,, és, . . ., &. L'ordre des permutations s'établit d’après le 
principe suivant. Voyons d’abord les permutations qui commencent 
par ë,. Par hypothèse, elles peuvent être toutes ordonnées conformé- 
ment au théorème, puisqu’en fait il faut ordonner toutes les permu- 
tations de 7 — 1 nombres. 

Dans la dernière permutation ainsi obtenue effectuons une trans- 
position pour que la permutation commence par le nombre i.. Ensuite 
ordonnons de même que dans le cas précédent toutes les permutations 
qui commencent par le nombre donné, etc. Par ce moyen on peut 
ordonner toutes les permutations de z nombres. 

Pour cette disposition des permutations de rz nombres la parité 
des permutations voisines sera opposée. Compte tenu de la parité 
du nombre nr! pour n>2, on déduit que le nombre de 
permutations paires de r éléments est égal au nombre de permuta- 


: : d s. 1 
tions impaires et à z nl. 


Exercices 


4. Quelle est la parité de la permutation 5, 2, 3, 1, 4? 

2. Montrer que quelle que soit une permutation paire (impaire), elle ne 
peut être ramenée à la normale en un nombre impair (pair) de transpositions. 

3. Considérons un couple de permutations i;, is, . .., in ©t 1,2, ...,n. 
Ramenons à la forme normale la première permutation à l’aide des transposi- 
-tions en réalisant pour chacune d'entre elles une transposition de nombres 
quelconques de la deuxième permutation. Montrer qu'à la fin du processus la 


deuxième permutation aura la même parité que la permutation à,, is, . .., in. 


$S 39. Existence d’un volume orienté 


Examinons maintenant la question de l’existence du volume 
orienté d’un système de vecteurs. Supposons qu'on ait choisi dans 
l’espace E, un système orthonormé z,, z,, . . ., z, Sur lequel, d’après 
la condition C de (34.4), le volume orienté doit être égal à l'unité. 
Soit Zi, Tes + - +, Th Un Système arbitraire de vecteurs de Z,. Le systè- 
me Zj, 2e, + - +, 2 étant une base de Æ,, pour tout vecteur zx il existe 
une décomposition 


Ti = Gi + Giote F ... H Gintn (39.1) 
par rapport à cette base, où «;; sont des nombres. 


Si un volume orienté existe, d’après la condition À de (34.4) 
nous pouvons Île transformer consécutivement en utilisant les dé- 
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compositions (39.1): 


v<£ (zs, Lo; CRE | Z:)= 


n n n 
= V* (2 Gigi 21 Aajeje es 21 int) = 


J1—= J2= Jn— 
. € & 
— > ai (2 2 A jZÿos RS D Anÿ,35,) 7 
Ji=1 Je=1 Jn= 
ñn ñn n 
— >, à aija25V + (Zi Zjas ee.) à» An, 2j.) =. 
Ji=1 J9=1 Jn=1 
ñn n Le 
= } » .. 2 Ajjado js 
J1=1 J2=1 Jn=1 


... An V® (Sir Zjss zj.). (39.2) 


Dans la dernière somme »7-tuple les termes sont pour la plupart 
nuls, puisque d’après la propriété 1, le volume orienté d’un système 
de vecteurs est nul si deux vecteurs du système coïncident. C'est 
pourquoi parmi les systèmes z,,, z,,, . . ., Z;, il Convient d'examiner 
seulement ceux pour lesquels la collection d'indices j;, je, + + .; jn 
est une permutation de r nombres 1, 2, ..., r. Or, dans ce cas, 


VS (ss Zjgr zj,)= +1 


suivant la parité ou l’imparité de la permutation des indices. 
Ainsi, si un volume orienté existe, il doit s'exprimer par les 
coordonnées des vecteurs z;, Z:, . . ., Zn dans la base 2,, Ze, . . ., 2h: 


VE (aus Zn ces En) = DIT Gi Go, +. nÿ (39.3) 


La sommation s’effectue ici sur toutes les permutations des indices 
Jar Jos + + +» În des nombres 1, 2,..., r, alors que le signe « plus » ou 
« moins » est pris en fonction de la parité ou de l’imparité de la 
permutation. 

Prouvons que la fonction donnée par le second membre de (39.3) 
vérifie toutes les conditions qui définissent un volume orienté. 
Supposons qu’un vecteur x, soit une combinaison linéaire de deux 
vecteurs x, et z;, c'est-à-dire 


Tp=Atp + Pr 


pour certains nombres &, f. Désignons par a,;, a;; respectivement 


les coordonnées des vecteurs z;, x; par rapport à la base z,. z,,. 


PAT 
Il est évident alors, que 


Gp} = Cap; + Par; 
9—91090 
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pour tout ÿ de 1 à nr. Ensuite, il vient 


à Æ dj, . dj, …. Anÿ, = DE Gi, (œap;, + Bar: ) … Anj, = 


= aÿ di, --. Api, + an +B > HE ai, ... pi, +: Ari,» 
et la condition A de (34.4) est remplie. 

Supposons que nous échangeons deux vecteurs quelconques du 
système Z,, Ze, . . ., Z,. Dans ce cas la fonction (39.3) change de 
signe puisque la parité de chaque permutation change. Comme nous 
l’avons constaté plus haut, la linéarité par rapport à chaque variable 
indépendante entraîne que la propriété démontrée est équivalente à 
la condition B de (34.4). 

Enfin, considérons la valeur de la fonction construite sur le 
système de vecteurs Z,, Z:, . . ., Z,. Pour ce système les coordonnées 


a;; sont de la forme 


F2 si if j, 
HI 4, si ij. 


Par conséquent, parmi les termes de (39.3) un seul terme a,;;as2. . . &nn 
n’est pas nul. La permutation 1, 2, ..., n est paire, les éléments 
A1, Œogs + + + Ann Valent l'unité chacun, donc la fonction vaut 1 sur 
le système orthonormé 2,, Z:, . . ., Zn. 

Ainsi, toutes les conditions (34.4) sont remplies et la fonction 
(39.3) est l'expression du volume orienté d’un système de vecteurs 
par les coordonnées. Cette expression est unique en vertu us l’unicité 
d’un volume orienté. 


Exercices 
1. En déduisant la formule (39.3) l'utilisation de l'orthonormalité du 
système 2j, Z2, « - -, 2n a-t-elle été essentielle? 


2. Quels changements subirait la formule (39.3) si on n'adopte pas dans la 
condition C de (34.4) que le volume orienté est égal à l’unitéà 
3. Dans quelle mesure la condition B de (34.4) a-t-elle été essentielle pour 


déduire la formule (39.3)? 
4. La formule (39.3) changera-t-elle si on considère le volume orienté 


dans un espace complexe? 


$ 40. Déterminants 


Soient Z;, Ze, - . -, Zn des vecteurs d’un espace euclidien donnés 
par leurs coordonnées 


Li = (ass; Aj2s Gin) 
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par rapport à la base (21.7). Disposons les nombres a;; dans un 
tableau À de la façon suivante 


An: An2 Ann 


Ce tableau s'appelle matrice carrée d'ordre n, les nombres a;; 
étant appelés éléments de la matrice. Si les lignes de la matrice sont 
numérotées de haut en bas, et les colonnes de gauche à droite, le 
premier indice d’un élément est le numéro de la ligne et le deuxième 
celui de la colonne. Pour les éléments @;,, &s, . . ., &nn On dit qu'ils 
forment la diagonale principale de la matrice À. 

N'importe quels n° nombres peuvent former une matrice carrée 
d'ordre n. Si l’on interprète les éléments d’une ligne d’une matrice 
comme coordonnées d’un vecteur de À, par rapport à la base (21.7), 
alors toutes les matrices carrées d'ordre » et tous les systèmes ordon- 
nés de 2 vecteurs de l’espace À, seront liés par une correspondance 
biunivoque. 

Dans l’espace /?,, de mème que dans tout autre espace, il existe 
un volume orienté. Ce volume est unique si on lui impose la condition 
C de (34.4) sur le système de vecteurs (21.7). En partant de la cor- 
respondance biunivoque indiquée, nous déduisons qu’une fonction 
est définie sur l’ensemble de toutes les matrices carrées. Compte tenu 
de (39.3), on déduit la définition suivante de cette fonction. 

On appelle déterminant d'ordre nr associé à la matrice À la somme 
algébrique de nr! termes composée d’après la loi suivante. Les termes 
du déterminant sont constitués de toutes sortes de produits de n 
éléments de la matrice, pris un à un dans chaque ligne et chaque 
colonne. Le terme est muni du signe « plus », si les indices des colon- 
nes forment une permutation paire à la condition que les éléments 
eux-mêmes se rangent dans l’ordre croissant des numéros des lignes, 
et du signe « moins » dans le cas contraire. 

S'il faut indiquer la forme explicite des éléments de la matrice 
d’un déterminant nous le désignerons par le symbole 


Œiy 2 ee in 


det[ 21 ‘22 -°- en (40.1) 


Lorsque nous n’en aurons pas besoin, nous utiliserons une notation 
plus simple 


det À, 
9 
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en n'indiquant que le symbole de la matrice À. Les éléments de la 
matrice du déterminant seront appelés également éléments du dé- 
terminant. 

Un déterminant coïncide avec le volume orienté du système de 
lignes de sa matrice. C’est pourquoi pour étudier un déterminant, on 
peut utiliser tous les faits relatifs au volume et au volume orienté. 
En particulier, un déterminant est nul si et seulement si les lignes 
de la matrice sont linéairement dépendantes ; un déterminant change 
de signe lorsqu'on échange deux lignes quelconques, etc. À présent 
notre discussion portera sur celles des propriétés d’un déterminant 
qui sont difficiles à démontrer sans faire appel à son expression 
explicite par les éléments de la matrice. 

Appelons transposition la transformation d’une matrice qui à 
ses lignes substitue ses colonnes et à ses colonnes, ses lignes de mêmes 
numéros. La transposée d’une matrice À se note À’. On dit respecti- 
vement que le déterminant 


€: dos . . Œn1 
det Ay2 oo ce. And 


Œin on +++ Ann 


ou det À’ s'obtient par transposition du déterminant (40.1). Par 
rapport à la transposition un déterminant possède la propriété im- 
portante que voici: 

Une transposition ne change pas le déterminant d'une matrice 
quelle qu'elle soit. 

En effet, le déterminant d'une matrice À se compose des termes 


Qi, 425, se Anj (40.2) 


dont le signe est défini par la parité de la permutation j;, je, . . ., ja. 
Tous les facteurs du produit (40.2) de la transposée 4” appartiennent 
à des lignes et des colonnes distinctes, c’est-à-dire leur produit est 
un terme du déterminant transposé. Notons a;; les éléments de la 
matrice À’. Il est clair que ai; = a;;; donc 


dij,d2j, se Anj, = 4; 10,2 es dj n- (40.3) 


Disposons les éléments du second membre de (40.3) dans l’ordre 
croissant des numéros des lignes. La permutation des indices des 
colonnes aura alors la même parité que la permutation j,, je, . . ., Jjn. 
Mais cela signifie que le signe d’un terme (40.2) dans le déterminant 
transposé sera le même que dans le déterminant initial. Par consé- 
quent, les deux déterminants contiennent les mêmes termes de mêmes 
signes, c’est-à-dire qu'ils coïncident. 

Cette propriété entraîne que dans un déterminant les lignes et 
les colonnes jouent le même rôle. Pour cette raison, les propriétés 
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démontrées dans ce qui précède pour les lignes sont également 
valables pour les colonnes. 

Examinons un déterminant d d’ordre #7. Choisissons dans sa 
matrice k lignes et À colonnes quelconques. Les éléments aux inter- 
sections des lignes et des colonnes retenues forment une matrice 
d'ordre k. Le déterminant de cette matrice est appelé mineur d'ordre 
k du déterminant d. Le mineur des À premières colonnes et À premiè- 
res lignes s'appelle mineur principal. 

Soit maintenant M un mineur d'ordre # d'un déterminant d 
d'ordre r. Si nous supprimons les lignes et les colonnes dont les 
intersections fournissent le mineur À], il reste un mineur Ÿ d'ordre 
n — k. Il est appelé mineur complémentaire de M. Inversement, en 
supprimant les lignes et les colonnes des éléments du mineur W, 
on obtient évidemment le mineur A. Ainsi, on peut parler d’un 
couple de mineurs complémentaires l’un par rapport à l’autre. 

Si un mineur M d'ordre À est formé par les lignes indiciées 


ls dos «+ « +, ir et les colonnes indiciées }j;, je, . . ., jr, le nombre 
k 
> (ip+jp) 
(— 1}! N (40.4) 


est dit cofacteur du mineur M. 

Théorème 40.1 Le de Laplace). Soient k lignes 
(colonnes) choisies arbitrairement (1 << k < n — 1) d'un déterminant 
d d'ordre n. La somme de produits de tous les mineurs d'ordre k que 
contiennent les lignes (colonnes) retenues par leurs cofacteurs est 
égale au déterminant d. 

Démonstration. Interprétons les colonnes de la matrice 
du déterminant d comme Îles vecteurs z;,, z:, . . ., x, de l’espace À,. 
La somme de produits des mineurs d'ordre À que contiennent les 
lignes choisies par leurs cofacteurs peut être envisagée comme une 
fonction F (x, z2, . . .. z,) des vecteurs z;, ze, . . ., Zn 

Cette fonction est bien linéaire par rapport à toute variable 
indépendante du fait que les mineurs et les cofacteurs jouissent eux 
aussi de cette propriété. Sur un système orthonormé (21.7) elle vaut 
l'unité, ce que l’on prouve aisément par vérification directe. Si 
nous montrons qu'en échangeant deux vecteurs quelconques la 
fonction F (x;, z:, . . ., Zn), change de signe, cette dernière coin- 
cidera avec le volume orienté du système de vecteurs Z;, Ze, + + «+, Tn- 
Mais le volume orienté coïncide avec le déterminant de la matrice 
dont les lignes sont formées par les coordonnées des vecteurs. Puisque 
le déterminant d'une matrice coïncide avec celui de sa transposée, 
le théorème de Laplace est démontré. 

Il est évident qu'il suffit d'examiner le cas où on change deux 
vecteurs voisins, car la permutation de deux vecteurs quelconques 
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se ramène toujours à un nombre impair de permutations de vecteurs 
voisins. Ce fait a été démontré au $ 38. 

Soient zx; et z;+, les vecteurs à permuter. Associons par une 
correspondance biunivoque les mineurs des lignes choisies du dé- 
terminant initial et du déterminant aux colonnes échangées. Notons 
par & la collection d'indices des colonnes déterminant le mineur. 
Les cas suivants sont alors possibles: 


1. i, it 1Co, 
2. i, it 1€, 
8. iCo, i+16€ ow, 
4. i+1Co, i£o. 


Dans les cas 1, 2 associons à ce mineur le mineur dont la collec- 
tion d'indices des colonnes est w, et dans les cas 3, 4, le mineur dont 
la collection d'indices des colonnes s'obtient de w en substituant 
respectivement i+i1àaie iàa i+ 1. 

Constatons que dans tous ces cas les mineurs correspondants se 
composent de mêmes éléments. Qui plus est, dans les cas 2 à 4 ils 
coincident, et dans le cas 1 ils ne diffèrent que par le signe, car dans 
l’un d’eux deux colonnes sont échangées l’une par rapport à l’autre. 
Pour des causes analogues, dans le cas 2, les mineurs complémentai- 
res correspondants diffèrent par le signe; dans les autres cas ils 
coïncident. Les cofacteurs se distinguent des mineurs complémen- 
taires seulement par les signes, car le signe d’un cofacteur est défini 
par la parité de la somme des indices des lignes et des colonnes qui 
forment le mineur. Dans les cas 1, 2, ces sommes sont les mêmes 
pour Îles mineurs correspondants, et dans les cas 3, 4, ils diffèrent 
d’une unité. 

En comparant maintenant les termes correspondants de la fonc- 
tion F (x,, ze, . . ., x,) et de la fonction obtenue par la permutation 
des vecteurs z; et z;4,, on constate qu'ils diffèrent seulement par les 
signes. Par conséquent, lorsqu’on permute deux vecteurs voisins la 
fonction F'(x,, Z+, . . ., zh) change de signe. 

On applique souvent un cas spécial du théorème démontré où 
l'on ne choisit qu’une ligne ou une colonne. Le déterminant d'une 
matrice d'ordre un coïncide avec son élément unique. Le mineur à 
l'intersection de la i-ième ligne et de la j-ième colonne est donc égal à 
l'élément a;;. Désignons par 4;; le cofacteur de l'élément a;;. D’après 
Je théorème de Laplace, on a pour tout à 


disAii + Gino +... HainAin =d. (40.5) 


Cette formule s'appelle développement d'un déterminant suivant la 
i-ième ligne. D'une façon analogue, pour tout jÿ, on a 


GyjA 5 - QojA 2j + si 'E à La, jAhj = d, (40.6) 
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ce qui donne le développement d'un déterminant suivant la j-ième 
colonne. 

Remplaçons dans le développement (40.5) les éléments de la 
i-ième ligne par la collection de 7 nombres arbitraires b,, b:, . . ., b,. 
L'expression 


biA;1 + brAio + ... + bnAih 


est le développement suivant la i-ième ligne du déterminant 


(40.7) 


An! Zn2 -.. Ann 


qui s'obtient à partir du déterminant d en remplaçant la i-ième 
ligne par la ligne constituée de nombres b,, b., . . ., b,. Choisissons 
maintenant pour ces nombres les éléments de la k-ième ligne du 
déterminant d avec À Æi. Le déterminant (40.7) est alors nul du 
fait qu'il a deux lignes identiques. Il s'ensuit que 


ApiA jy 1 Apo A j9 +... LapnAin = 0, ki. (40.8) 
D'une façon analogue, 
air Ai; + a2r A2) +... +anndoj= 0, kÆ JE (40.9) 


Ainsi, la somme de produits des éléments d’une ligne (colonne) 
par les cofacteurs des éléments correspondants d’une autre ligne 
(colonne) du même déterminant est nulle. 

A titre de conclusion notons que toute la théorie des déterminants 
s'étend sans aucune modification au cas des matrices complexes. 
La seule chose qui disparaît c’est l'interprétation géométrique due 
à la notion de volume. 


Exercices 


1. Ecrire les expressions d'un déterminant du deuxième et du troisieme 
ordre par les éléments de sa matrice. Comparer avec les expressions (34.6). 
2. Ecrire l'inégalité d'Hadamard pour le déterminant des matrices À et 4’. 

3. Le déterminant d'ordre »# dont tous les éléments sont égaux en module 
à Aro vaut nr. Prouver que ses lignes (colonnes) forment une base ortho- 
gonale. 

4. Quelle est la valeur d'un déterminant si ses éléments vérifient les condi- 
tions a;;-: 0 pour i>j (Gi<j, izj,i<j)? 

5. Les éléments d'un déterminant vérifient les conditions a;; := 0 pour 
ë>k et y L k. Montrer que le déterminant est égal au produit du mineur 
principal d'ordre 4 par son mineur complémentaire. 

6. Supposons que les éléments d'une matrice complexe À vérifient les 


conditions a;; — a;; pour tout i, j. Montrer que le déterminant d'une telle 
matrice cst ün nombre réel. 
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$ 41. Dépendance linéaire et déterminants 


L'une des applications les plus répandues des déterminants est 
celle des problèmes associés à la dépendance linéaire. Supposons qu’il 
faille déterminer une base de m vecteurs x;, +, . . ., zn donnés dans 
un espace X, de dimension ». Choisissons dans X,, une base quelcon- 
que et examinons le tableau rectangulaire 


A= “ “0e … (41.1) 


Ami Am2 ++ Amn 


dont les lignes sont les coordonnées des vecteurs donnés dans la base 
choisie. 

Un tel tableau s'appelle matrice rectangulaire. De même qu’aupa- 
ravant, le premier indice de l'élément a;; est le numéro de la ligne 
qui contient l'élément, le deuxième indice étant le numéro de la 
colonne. Si nous voulons insister sur le nombre des lignes et des 
colonnes de la matrice À, nous écrirons À (m X n) ou dirons que À 
est une matrice m X n. La matrice À (n X nr) ou À (nn) est toujours 
appelée matrice carrée d'ordre #2. En plus de À, nous examinerons 
aussi sa transposée A’. Si les dimensions de À sont m X n, ceux 
de À’ sont nr X m. 

Dans une matrice rectangulaire À (m X n) on peut cette fois 
encore indiquer les mineurs différents dont l’ordre, certes, ne dépasse 
pas le plus petit des nombres m, n. Si les éléments de la matrice ne 
sont pas tous nuls, l’ordre r maximal de ses mineurs non nuls est 
appelé rang de la matrice À. Tout mineur non nul d'ordre r s'appelle 
mineur de base, et les lignes et les colonnes qui le forment lignes et 
colonnes de base. Il est clair qu’il peut y avoir plus d’un mineur de 
base. Par définition, le rang d'une matrice nulle est nul. 

Considérons les lignes d’une matrice À comme vecteurs. Il est 
évident que si nous trouvons la base de ces vecteurs lignes, les vec- 
teurs NN de l’espace X, engendront une base des vecteurs 
LT Te us 

Théo r è m e 41.1. N'importe quelles lignes de base forment 
une base de vecteurs lignes d'une matrice. 

Démonstration. Il faut démontrer que les lignes de base 
sont linéairement indépendantes et que toute ligne de la matrice 
s'exprime linéairement par ces lignes de base. 

Si les lignes de base étaient linéairement dépendantes, une de 
ces lignes s’exprimerait linéairement par les autres. Mais dans ce 
cas le mineur de base serait nul, ce qui contredit l’hypothèse. 

Adjoignons maintenant aux lignes de base une autre ligne quel- 
conque de la matrice À. D’après la définition du mineur de base, 
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tous les mineurs d'ordre r + 1 de ces lignes sont nuls. Supposons que 
les lignes données soient linéairement indépendantes. En les complé- 
tant jusqu’à une base nous construirons une matrice carrée à déter- 
minant non nul. Mais le développement de ce déterminant suivant 
les r + 1 lignes initiales nous fait constater qu’il est nul. Cette 
contradiction signifie que toute ligne de À s’exprime linéairement 
par les lignes de base. 

Le théorème démontré permet de ramener la recherche d’une 
base d’un système de vecteurs à celle d'un mineur de base d’une 
matrice. Le déterminant de la transposée coïncidant avec celui de la 
matrice initiale, il est clair que le théorème 41.1 est vrai non seule- 
ment pour les lignes, mais aussi pour les colonnes. Cela signifie que 
pour toute matrice rectangulaire, le rang de son système de vecteurs 
lignes est égal au rang de son système de vecteurs colonnes. Si on ne 
tient compte que de la notion de rang d'un système de vecteurs, ce fait 
n'est pas évident. 

Dans un espace à produit scalaire la dépendance ou l’indépendan- 
ce des vecteurs Z;, Ze, . . ., Tm peuvent aussi bien être établies sans 
recourir au développement par rapport à la base. Considérons le 
déterminant 


(Zi, Zi) (ris T2) +. (T1, Zn) 
(Tas 74) (Z2, T2) ... (Ze Zm) 


(Zm: : 7) (Zm Ta) Ti (Tm: Tm) 


G(xi, Ze, .., Zm) =det 


dit de Gram d'un système de vecteurs z,, Ze, . . ., Tm- 
Théorème 41.2. Un système de vecteurs est linéairement dé- 
pendant si et seulement si son déterminant de Gram est nul. 
Démonstration. Soit Ty, Ze, ..., ZIm un système de 
vecteurs linéairement dépendant. Il existe alors des nombres 
js Lay + + y Em NON tous nuls tels que 


ŒnTy + Œolo He. + Emlm = 0. 


La multiplication scalaire de cette égalité par x; pour tout & fait 
constater que les colonnes du déterminant de Gram sont linéaire- 
ment dépendants, c’est-à-dire que le déterminant est nul. 
Supposons maintenant que le déterminant de Gram soit nul. 
Les colonnes sont alors linéairement dépendantes, c’est-à-dire il 
existe des nombres &;, &:, ..., &m non tous nuls tels que 


Œ (Zi T1) + Le (ri, T2) +... + Am (ti, Tm) = 0 
pour tout i. Mettons ces égalités sous la forme suivante 


(Ti, Gta + Goto + 0 + Amtm) = 0. 
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En les multipliant respectivement par &,, &:, ..., 4m et en addi- 
tionnant, on obtient 


| Œti + ele + . . . + Œmtm | = 0. 


Cela signifie que 
ŒaTa + Lolo +... + AEmlm = 0, 


c'est-à-dire que les vecteurs z;, z+, . . ., Zm sont linéairement dé- 
pendants. 


Exercices 


1. Une matrice aux mineurs tous nuls, que représente-t-elle ? 

2. Les lignes de base et les colonnes de base d'une matrice carrée sont- 
clles des systèmes équivalents de vecteurs? 

3. Les transformations élémentaires des lignes et des colonnes du $ 15 
<hangent-elles le rang d’une matrice? 

4. Démontrer les inégalités 


n 
OL G(z4, Tor +. En) < [I (zi, zi). 
1=1 


Dans quels cas se transforment-elles en égalités? 
5. 11 est évident que 


Demontrer que pour toute approximation du nombre V2? par une fraction 
décimale finie p, on a 


det (? “) =: 0. 


$ 42. Calcul des déterminants 


Le calcul direct d'un déterminant à l’aide de son expression 
explicite par les éléments de sa matrice est rarement appliqué dans 
la pratique par suite du grand volume de travail qu'il impose. Un 
déterminant d'ordre x se compose de nr! termes; or, pour calculer 
chaque terme et l’additionner aux autres, il faut réaliser r opéra- 
tions arithmétiques. Même si cette tâche est assumée par une cal- 
culatrice faisant 10% opérations arithmétiques par seconde, le calcul 
d'un déterminant d'ordre cent, par exemple, durera plusieurs mil- 
lions d'années. 

L'un des procédés les plus efficaces est fondé sur l’idée suivante. 
Soit 4 un élément non nul de la matrice À. Appelons-le élément 
directeur ou pivot. Si à toute i-ième ligne, i À, on ajoute la k-ième 
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ligne multipliée par un nombre arbitraire &;, comme on le sait, le 
déterminant ne changera pas. Soit 


et réalisons la procédure indiquée pour tout i 4. Alors, tous les 
éléments de la p-ième colonne de la nouvelle matrice, sauf le pivot, 
seraient nuls. En développant le nouveau déterminant suivant la 
p-ième colonne on ramène le calcul d’un déterminant d'ordre r 
à celui d’un déterminant d'ordre z — 1. Avec ce dernier on procède 
de façon analogue, etc. 

L’algorithme qui vient d’être décrit s'appelle méthode de Gauss. 
Pour calculer d’après cette méthode un déterminant d'ordre nr il 


, . « « 2 ? e . ue : 
faut réaliser à peu près _. n° opérations arithmétiques seulement. 


Une’ calculatrice effectuant 10% opérations arithmétiques par 
seconde peut maintenant calculer un déterminant d'ordre 100 plus 
vite qu'en une seconde. 

A titre de conclusion notons que dans les conditions où la réali- 
sation des opérations arithmétiques est approchée et la donnée de 
l'information approximative, les résultats du calcul d’un détermi- 
nant doivent être considérés avec prudence. Si l'on juge sur la dé- 
pendance ou l’indépendance linéaires d’un système de vecteurs 
seulement d’après le fait que le déterminant correspondant est nul 
ou non nul, l'instabilité dont nous avons parlé au $ 22 peut fausser 
les conclusions. Il ne faut pas l'oublier en utilisant les déterminants. 


Exercices 


1. Pourquoi le calcul d’un déterminant d'après la méthode de Gauss est 
bien plus rapide que son calcul direct? 

2. Supposons que tous les éléments d'un déterminant ne dépassent pas 
l'unité en module et qu'en calculant chacun de ses termes nous fassions une 
erreur d'ordre €. Pour quels n le calcul direct d’un tel déterminant est raison- 
nable du point de vue de la prions 

3. En se basant sur la méthode de Gauss construire un algorithme de cal- 
cul du rang d’une matrice rectangulaire. Que signifie l'application de cet algo- 
rithme dans les conditions des calculs approchés? 


CHAPITRE 5 


DROITE ET PLAN 
DANS UN ESPACE VECTORIEL 


$ 43. Equations d’une droite et d’un plan 


Les objets immédiats de notre exposé sont une droite et un plan 
dans les espaces des segments orientés. Si un système de coordonnées 
est donné, les coordonnées des points d’une droite ou d’un plan ne 
peuvent être quelconques, elles doivent satisfaire à certaines rela- 
tions. Nous passons à présent à la déduction de ces relations. 

Fixons sur un plan un système de coordonnées cartésien Ozxy 
et une droite Z. Examinons un vecteur quelconque non nul 


n = (4, B), (43.1) 


perpendiculaire à L. Evidemment, tous les autres vecteurs perpen- 
diculaires à la droite donnée sont colinéaires à n. 

Choisissons sur la droite un point arbitraire M, (xo, Yo). Tous 
les points M (x, y) de la droite Z et seulement eux possèdent cette 
propriété que les vecteurs M,M et nr sont perpendiculaires, c’est-à- 
dire 


(MM, n)=0. (43.2) 
Etant donné que 
MM =(2— 20 y— wo), 
(43.1), (43.2) entraînent que 
À (2x — Zo) + B (y — yo) = 0. 
En introduisant la notation 
—Ars — By = C, 


nous constatons que dans le système donné Oxy, les coordonnées des 
points de la droite Z et seulement elles vérifient l’équation 


Az + By+C=t. (43.3) 
Parmi les nombres 4, B, il yen a un non nul. Pour cette raison 


nous appellerons (43.3) équation du premier degré par rapport aux 
variables x, y. 
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Démontrons maintenant que toute équation du premier degré 
(43.3) définit, par rapport au système de coordonnées Ozxy une cer- 
taine droite. L’équation (43.3) étant du premier degré au moins l’une 
des constantes À, B est non nulle. Par conséquent, l'équation (43.3) 
possède au moins une solution x,, y,s. par exemple: 


BC 


To Xp: VAE c: 


De plus, 
Atos + Byo + C = 0. 


En retranchant cette dernière identité de l’équation (43.3), on 
obtient l'équation 


A (z — 29) + B (y — yo) = 0 


équivalente à (43.3). Mais cela signifie que tout point M (x, y) dont 
les coordonnées vérifient (43.3) appartient à la droite passant par le 
point M, (to, Yo) et perpendiculaire au vecteur (43.1). 

Résumons: un système de coordonnées étant fixe sur un plan, 
toute équation du premier degré définit une droite et les coordonnées 
des points de toute droite vérifient une équation du premier degré. 
(43.3) s'appelle équation générale d'une droite sur un plan, le vecteur 
n de (43.1) étant le vecteur normal d’une droite. 

Le cas d’un plan de l’espace n’impose aucune modification de 
principe. Fixons un système cartésien Oxyz et considérons un plan x. 
Choisissons cette fois encore un vecteur non nul quelconque 


n — (4, B, C), (43.4) 


perpendiculaire à x. En reprenant les raisonnements ci-dessus con- 
cluons que tousgles points M (x, y, z) du plan x et seulement eux 
vérifient l’équation 

Az + By + Cz+ D = 0, (43.5) 


que aous appellerons également équation du premier degré ar rap- 
port aux variables zx, y, z. 

Si nous reprenons l'examen de l'équation arbitraire du premier 
degré (43.5), nous verrons qu'elle possède également au moins une 
solution zy, Yo, Zo, Par exemple 


D 
Aï+B2FC:' VW —%Ep+c) 
a 
WE B+ C2" 
Etablissons ensuite que tout point M (x, y, z), dont les coordonnées 


satisfont à l'équation (43.5), appartient au plan passant par 
Mo (Zos Yor 20) et perpendiculaire au vecteur (43.4). 


To — 


142 DROITE ET PLAN DANS UN ESPACE VECTORIEL [CH. 5 


Ainsi, dans un système de coordonnées fixé dans l’espace, toute 
équation du premier degré définit un plan, et les coordonnées des 
points de tout plan vérifient une équation du premier degré. (43.5) 
s'appelle équation générale d’un plan dans l'espace et le vecteur nr 
de (43.4) vecteur normal d’un plan. 

Voyons maintenant comment sont liées entre elles deux équa- 
tions générales qui déterminent une même droite ou un même plan. 
Soient, pour fixer les idées, 


Az + Biy+Ciz-+ Di =0, | 
Az + Boy + Coz <- D, = 0 


deux équations d’un plan sx. 
Les vecteurs 


(43.6) 


Ny — (A3, B;, Ci), No — (4, B:, Ca) 


sont perpendiculaires au même plan x, donc colinéaires. Comme ils 
sont aussi non nuls, il existe un nombre ft tel que 


A; — Na 


ou 


A1 =tA;, Bi=tB» Ci = Ce. (43.7) 


En multipliant la deuxième équation (43.6) par t et en y retranchant 
la première, on obtient grâce aux relations (43.7) que 


Par conséquent, Les coefficients des équations générales qui définissent 
une même droite ou un même plan sont proportionnels. 

Une équation générale est dite complète si tous ses coefficients 
sont différents de zéro. Dans le cas contraire elle est dit incomplète. 
Examinons l'équation complète d’une droite (43.3). Ses coefficients 
étant non nuls on peut la mettre sous la forme 


E 4 y : 
UE 

À  B 

Si l’on note 
C C 
a = TA ’ b— TB ! 
on obtient une nouvelle forme de l'équation d'une droite 
z y 
PUS 


Cette équation s'appelle équation d'une droite « donnée par ses 
coordonnées à l’origine ». L'interprétation géométrique des nombres 
a, b est bien simple. Ils sont égaux aux mesures des segments que 
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découpe la droite sur les demi-axes des coordonnées (fig. 43.1). 
L’équation complète d’un plan peut être évidemment ramenee à 
une forme analogue 


TZ y CUS 
arbres 


Des équations incomplètes correspondent à des cas particuliers 
de la position d’une droite et d’un plan. Il est utile de les retenir, 
car ils sont d’un usage assez fréquent. 
Par exemple, avec C — 0, l'équation 
(43.3) détermine une droite qui passe 
par l’origine des coordonnées, avec B — 

— C = 0, la droite se confon davec l'axe 
Oy, etc. Avec À = O0, l'équation (43.5) 
définit un plan parallèle à l'axe Ox; 4 
avec À = B = D = 0, le plan se cou- 
fond avec le plan de coordonnées Ozxy, 
etc. 

Tout vecteur non nul parallèle à une 
droite est appelé son vecteur directeur. 
Considérons, par exemple, le cas de l’es- Fig. 43.1. 
pace pour chercher l'équation d'une droi- 
te passant par un point donné Mo (xo, Yo» Zo) et ayant un vecteur 
directeur donne 


a 


g={(l}, m,n). 


Le point M (zx, y, z) appartient évidemment à la droite indiquée si 


et seulement sifles vecteurs M,M et q sont colinéaires, c'est-à-dire 
si et seulement si les coordonnées de ces vecteurs sont proportion- 
nelles : 


T— To _Y—Y0 __=2—Z 
2 HE, (43.8) 


Ce sont là précisément les équations recherchées d’une droite. 
I] est d'usage de les nommer équations canoniques d’une droite. I] est 
clair que dans le cas d’une droite sur un plan, l’équation sera de la 
forme 


= : 1 , (43.9) 
si la droite passe par le point M, (xo, yo) et si son vecteur directeur 
est g = (l, m). 

Les équations canoniques permettent d'obtenir facilement l’équa- 
tion d’une droite passant par deux points donnés M,, M,. À cet 
effet, il suffit de choisir pour vecteur directeur M,, M,, exprimer 
ses coordonnées par les coordonnées des points M, et M, et les por- 
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ter dans les équations (43.8), (43.9). Par exemple, dans le cas d’une 
droite sur un plan nous aurons 


270; => y — Yo 


Zi—Z0 Yi —Y0? 
et dans le cas de l’espace, 


— 
RER 
— 


Remarquons que les dénominateurs des équations canoniques 
d'une droite peuvent être nuls. Aussi, dans ce qui suit, par toute 
proportion a/b = c/d faut-il entendre l'égalité ad = bc. Donc, 
l'annulation d’une des coordonnées du vecteur directeur signifie 
que le numérateur correspondant des équations canoniques est 
également nul. 

Pour donner une autre représentation analytique d’une droite, 
on considère souvent les coordonnées de ses points comme fonctions 
d'un certain paramètre auxiliaire £. Si nous adoptons comme para- 
mètre { la valeur des rapports égaux (43.8), (43.9), les équations 
d'une droite de l’espace se mettront sous la forme suivante: 


z=ZX+ lt, 
Yy=Yo+ Mi, (43.10) 
Z2= 29 + nt 


et celles d’une droite sur un plan, sous la forme d'équations ana- 
logues 


z= zo + lt, | 
Y= Yo + mt. 


Ces équations s'appellent équations paramétriques d’une droite. 
En donnant au paramètre £ des valeurs différentes, nous obtenons 
des points différents de la droite. 

L'utilisation de la notion de déterminant rend très commode 
la notation de différentes équations de droite et de plan. Déduisons, 
par exemple, l'équation d’un plan passant par trois points distincts 
non alignés Mi(zi, Yi, 21), Mo (Ze, Yes 22), M3 (Ta Yss Z3). Ces points 
n'étant pas alignés, les vecteurs 


MiMo=(tz2—Zi, Ye—Ys 22 — 24), 


(43.11) 


MiMa=(z3—2T1, Y3—Yu Z3—2) 


ne sont pas colinéaires. Le point M (x, y, z) appartient donc au même 
plan que les points M,, M,, M, si et seulement si les vecteurs M,M,, 
M;M, et 


MiM=(z— 2x, y—y1, Z2—2:) 
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sont coplanaires, c’est-à-dire si et seulement si le déterminant com- 
posé de leurs coordonnées est nul. Il vient donc, que 


T —Ty Y — Yi 2 —72: 
det À T>—Zsy Ya —Yy 22 — 21 | —0 (43.12) 
T3 — Li Us — Us Z23— 353: 
est une équation du plan recherché qui passe par les trois points 
donnés. 
Considérons, enfin, l’équation d’une droite dans l’espace per- 


pendiculaire à deux droites non parallèles et passant par un point 


donné. Supposons que les deux droites soient données par leurs 
équations canoniques 


Le vecteur directeur g de la droite recherchée doit être perpendi- 
culaire aux deux vecteurs 


Qu = (li My, 3), Ge = (le, Mao, No). 


Ces vecteurs ne sont pas colinéaires et on peut donc prendre pour g, 
par exemple, le produit vectoriel [g,qg.l. En appliquant l’expression 
des coordonnées du produit vectoriel par les coordonnées des facteurs 
et en utilisant les déterminants d’ordre deux, on obtient 


n in L m 
g= [et (7 | J det (7 k det (} ). 
Mo le To L L Mo 
Si la droite cherchée passe par le point M, (to, Yo Zo), Ses équations 
canoniques s’écrivent : 


Z— IQ y — Yo 2 — 29 


ma N4 EE n l si l4 m1 

det (me ) det (7 ci det (,° 
Du point de vue de principe, de nombreuses conclusions sur les 
équations d’une droite et d’un plan restent certainement valables 
pour n'importe quel système de coordonnées affine. L'utilisation 


exclusive des coordonnées cartésiennes rectangulaires est due surtout 
au fait qu'elles permettent de simplifier sensiblement l'exposé. 


Exercices 


1. Ecrire l'équation d’une droite dans un plan passant par deux points 
donnés en utilisant le déterminant d'ordre deux. Comparer le Résultat avec (43.12). 


L'affirmation que l'équation (43.12) est toujours celle d’un plan est-elle 
nec 


10—01090 
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3. Ecrire par analogie avec les équations (43.10) les équations paramétri 
ques d'un plan dans l'espace. Combien de paramètres doivent compter ces 


équations ? 
4. Chercher les coordonnées du vecteur normal à un plan passant par trois 


points donnés non alignés. 

5. Le lieu géométrique des points de l'espace dont les coordonnées sont 
des solutions d’un système de deux équations linéaires algébriques à trois incon 
nues. que représente-t-il ? 


$ 44. Disposition relative 


L'examen simultané de plusieurs droites et plans pose des proble- 
mes portant en premier lieu sur la détermination de leur position 


relative. 
Supposons que deux plans qui se coupent soient donnes par leurs 


équations générales 

A,z + BP,y + C,z + D, — 0, 

At + Boy + Coz + De = 0. 
Ces plans forment deux angles adjacents dont la somme vaut deux 
angles droits. Cherchons l’un de ces angles. Les vecteurs nr, = 
— (4,, B,, C)et nr. = (42, B,, C,) sont normaux et la recherche 
de l’angle entre les plans se ramène à celle de l’angle œ entre les 
vecteurs 7, +. D'après (25.5), on a 

A449 + BB + CiCo 


CRT GER CE UE BE CPE 


D'une façon tout à fait analogue on déduit la formule de l’angle 
de deux droites d’un plan, données par leurs équations générales 


Ait + By + C1 = 0, 
Az + By + C: = 0. 
L'un des angles @ formé par ces droites se calcule d’après la formule 
A42 + BB; | 
(Aÿ + 87) */* (43 + 85) © 
La condition de parallélisme de deux droites données par leurs 


équations générales est une condition de colinéarité de leurs vecteurs 
normaux, c’est-à-dire celle de proportionnalité de leurs coordonnées 


COS E = 


La condition de perpendicularité des droites coïncide avec la con- 
dition cos ® = 0, ou, ce qui revient au même, avec la condition 
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Certes, la condition 
du parallélisme de deux plans donnés également par leurs équations 
générales, et celle 
A4; + B,B: + CC; — 0 
de leur perpendicularité sont d’une forme analogue. 


Supposons maintenant que deux droites, dans l’espace par 
exemple, soient données par leurs équations canoniques 


os POP ee | PR nn | 
li m4 ñ1 d 


Etant donné que les vecteurs directeurs de ces droites sont g, — 
= (L,, m,, nm), ge = (ls, Mo, 2), On en tire de nouveau que l’un 
des angles œ entre les droites coïncide avec l’angle entre les vecteurs 
1» +. Par conséquent, 


Lilo + mymoe + nino 
(f+ mi nt)? (+ m3 + nt 


Respectivement, la proportionnalité des coordonnées 


COS ® — 


est une condition de parallélisme des droites, et l'égalité 
lile + MiMe + Nino = 0 


celle de leur perpendicularité. 

Il est clair que si deux droites ou deux plans, ou encore une 
droite et un plan sont donnés d’une manière à indiquer explicite- 
ment leurs vecteurs directeurs ou normaux, la détermination de 
l’angle qu'ils forment se ramène toujours à la détermination de 


l’angle entre ces vecteurs. Soient, par exemple, x un plan donné par 
son équation générale 


et Z une droite donnée par son équation canonique 
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Puisque l’angle @ entre une droite et un plan est complémentaire 
de l'angle + entre le vecteur directeur de la droite et le vecteur 
normal du plan (fig. 44.1), il vient 


| A+ Bm+Cn| 


sin ® == a mn 0 0 a ao 
(A2+ B2+ C2)! (24 m2 ne?) 2 


La condition 
Al+ Bm+Cn =0 


du parallélisme d’une droite et d’un plan, ainsi que celle 


de leur perpendicularité, sont évidentes. 

La donnée d’une droite et d’un plan sous la forme d’équation 
générale rend très efficace la résolution d’un problème important 
qui consiste à calculer la dis- 
tance d’un point à une droite 
et d’un point à un plan. Dans 
les deux cas les formules sont 
tout à fait analogues et nous 
allons nous borner à exami- 
ner l’un d'eux seulement. 

Soit x un plan de l’es- 
pace donné par son équation 
générale (43.5). Fixons un 

Fig. 44.1. point arbitraire M, (zo, Yo, 2). 

Abaissons du point M, la 

perpendiculaire sur le plan et notons son pied M, (x;, y,, z). 

La distance p (M,,x) du point M, au plan est égale à la longueur du 
vecteur M,M,;. 

Les vecteurs n — (4, B, C) et MoM, = (x — Zo, Yi — Yo: 
Z1 — Z,) sont perpendiculaires au même plan; ils sont donc coli- 
néaires. Il existe alors un nombre t tel que M,M, = in, c'est-à-dire 


Ty — To = (À, 

Yi — Yo = EP, 

Z1 — Zo = EC. 
Le point M, (z;, Y:, Z,) appartient au plan x. En résolvant les rela- 
tions obtenues par rapport à ses coordonnées et en portant ces der- 
nières dans l’équation du plan, on obtient 


__ Azo+ Byo+ Co + D 


do A+ B2+C? 
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Or, la longueur du vecteur r est égale à (4°? + B°? + C*)/?; il s’en- 
suit que | MM, | = |t |(4° + B° + C*)"*. Donc, 
__ 1 Axzo+Byo+Cz+D| 
P (M, a) = (A2 + B2 + C2y1/2 : 
En particulier, 
[D] | 

(42+ B? + C2)1/2 

Après l'équation générale (43.5) d’un plan nous allons examiner 
aussi ses équations de la forme 


+ (42+ B2+ C2) (Az + By+Cz+ D) = 0. 


p(0, x)— 


De deux signes possibles du premier membre choisissons celui qui 
est opposé au signe de D. Si D = 0, prenons un signe quelconque. 
Alors, le terme constant de cette équation est un nombre non positif 
—p, et les coefficients affectés à x, y, z sont les cosinus des angles 
entre le vecteur normal et les axes de coordonnées. L’équation 


x cos & + y cos B + z cos y — p = 0 (44.1) 
s'appelle équation normée d’un plan. Il est évident que 
p (Mo, x) = | x, cos & + y, cos B + z, cos y — p |, 
p (0, x) = p. 

Dans un plan la distance p (M,, L) d’un point M, (xs, Yo) à une 
droite L donnée par son équation générale (43.3) est définie par la 
formule analogue 
| Azo + Byo + C | 


M = 
p ( 0» L) (A2 + By 1/2? 


Voici l'équation normée d’une droite 
x cos a + ysin a — p = (. (44.2) 


Ici & est l’angle entre le vecteur normal et l’axe Oz. 


Exercices 


1. Quelle condition faut-il imposer aux vecteurs normaux pour que deux 
droites d'un plan (trois plans de l’espace) se coupent en un point? 

2. Sous quelle condition une droite (43.8) appartient-elle à un plan (43.5)? 

3. Sous quelle condition deux droites de l’espace données par leurs équa- 
tions canoniques appartiennent-elles au mème plan? 

4. Calculer les angles entre la diagonale d'un cube et ses faces. 

5. Déduire la formule de la distance dans l’espace entre un point et une 
droite de l’espace donnée par les équations canoniques. 
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$ 45. Plan dans un espace vectoriel 


Nous avons souligné à plus d'une reprise qu’une droite et un 
plan passant par l'origine de coordonnées s'’identifient dans l’espace 
des segments orientes à l’image géométrique d’un sous-espace. Mais 
par leurs propriétés ils diffèrent peu d’autres droites et plans obtenus 
par translation de ces sous-espaces. En voulant généraliser ce fait 
aux espaces vectoriels arbitraires, on aboutit à la notion de plan 
dans un espace vectoriel. 

Soit Z un sous-espace d’un espace vectoriel X. Fixons dans X 
un vecteur arbitraire z,. En particulier, ce vecteur peut appartenir 
à L. L'ensemble }Æ des vecteurs z qui s’obtiennent d’après la formule 


Z = Zo + y, (45.1) 


où y est un vecteur quelconque de Z, s'appelle plan dans l’espace 
vectoriel Æ. On dit vecteur de translation pour x, et sous-espace direc- 
teur pour L. Pour le plan ZX, on dit qu’il est obtenu par translation 
du sous-espace Z suivant le vecteur zx,. 

D'un pointfde vue formel, la notion de plan inclut les notions 
de droites et de plan (dans l’interprétation vectorielle!) dans les 
espaces de segments orientés. Mais nous ne savons pas pour le mo- 
ment si elleïpossède des propriétés analogues. 

Chaque vecteur du plan Æ est représenté d’une façon unique 
sous la forme: ide la somme (45.1). Si z = x0 + y et z = xo + ÿ', 
où y, y E L, on en déduit que y = y’. La formule (45.1) entraîne 
de plus que la différence de deux vecteurs quelconques du plan H 
appartient au sous-espace Z. 

Choisissons dans le plan Æ un vecteur arbitraire 2, = zo + ÿo. 
Mettons l'égalité (45.1) sous la forme 


Z = Zo + (Y — Yo). 


Les ensembles des vecteurs y et y — y, décrivent le même sous-espace 
L. C'est pourquoi cette dernière égalité signifie que le plan Æ peut 
s’obtenirtpar translation du sous-espace L suivant n'importe quel 
vecteur fixe du plan lui-même. 

Le plan Æ est un ensemble des vecteurs de X engendré par le 
sous-espace L et le vecteur de translation zx, d’après (45.1). Une circons- 
tance très importante est que tout plan peut être engendré par un 
seul sous-espace. Supposons qu'il n’en soit pas ainsi, c'est-à-dire 
qu'il existe encore un SOus-es pace directeur L’ et un vecteur de trans- 
lation z, engendrant le même plan H. Alors, pour tout z € H on a 
2 = Z0 + où y E L,et en même temps, z = x, + y’, où y’ € L’. 
I1 s'ensuit que le sous-espace L’ est l’ensemble ‘des vecteurs de X 
défini par la formule 


= (Zo— Y5) + y. 
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Etant donné que le vecteur nul appartient à L”, cette dernière 
formule entraîne que le vecteur (x, — x;) appartient à L. Mais cela 
signifie que le sous-espace L” est constitué par les mêmes vecteurs 
que le sous-espace L. 

Nous avons déjà constaté qu'un plan ne définit pas d’une fa- 
çon univoque un vecteur de translation. Toutefois, là aussi la ques- 
tion d'’univocité peut être résolue d’une façon parfaitement natu- 
relle. 

Admettons que l’espace vectoriel Æ soit muni d’un produit 
scalaire. Il est clair que le plan sera le même si au lieu d’un vecteur 
z, On prend ortrz,o- On peut donc sans limiter la généralité conside- 
rer que z, L ZL. Appelons dans ce cas x, vecteur de translation 
orthogonal. Maintenant on peut démontrer que chaque plan est 
engendré par un seul vecteur de translation. 

En effet, supposons qu’il existe deux vecteurs de translation x, 
et x; orthogonaux au sous-espace L, mais engendrant pour autant 
le mème plan }. Alors, pour tout vecteur y” € L, il existe un vecteur 
y" EL tel que x + y” = x5 + y”. On en déduit que x, — x € L. 
Mais d’après l'hypothèse zx, — x° 1 L. Donc x, — x, — 0, c'est- 
à-dire x, = 2. 

Cela signifie, en particulier, que dans un espace muni d’un pro- 
duit scalaire, tout plan ne possède qu’un vecteur orthogonal au 
sous-espace directeur. 

Deux plans sont dits parallèles si le sous-espace directeur de l'un 
d'eux est inclus dans le sous-espace directeur de l’autre. 

Cette définition est facile à justifier. Deux plans parallèles H,;, 
H, ou bien ne contiennent aucun vecteur commun, ou bien sont inclus 
l’un dans l’autre. Supposons que Æ,, H. possèdent un vecteur com- 
mun £,. Tout plan pouvant être obtenu par translation d’un sous- 
espace directeur suivant l’un quelconque de ses vecteurs, }, aussi 
bien que FH, s’obtiennent par translation des sous espaces correspon- 
dants suivant le vecteur z,. Mais l’un des sous-espaces est inclus 
dans l'autre, et de ce fait, l’un des plans sera également inclus dans 
l’autre. 

Un sous-espace est un cas particulier d’un plan. Il est évident 
que le sous-espace ZL est parallèle à tout plan Æ obtenu par transla- 
tion de ZL suivant le vecteur x,. La propriété démontrée des plans 
parallèles entraîne que Æ coïncide avec L si et seulement si x, € L. 

Considérons maintertant deux plans non parallèles H, et H.. 
Ils ne possèdent aucun vecteur commun, ou bien en possèdent un 
Dans le premier cas appelons H,, H, plans croisés, dans le second 
plans sécants. 

De mème que dans le cas des sous-espaces, l’ensemble des vecteurs 
appartenant à la fois à FH, et à H, sera appelé intersection des plans 
et noté A, f\ H,. Soient H, le plan engendré par une translation du 
sous-espace Z. et H. le plan engendré par une translation du sous- 
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espace Z,. Désignons 
H=H NH; L= LL. 


Théorème 45.1. Si l'intersection H contient un vecteur 2, 
elle se confond avec le plan engendré par la translation de l’intersec- 
tion L suivant ce vecteur. 

Démonstration. D’ après la condition du théorème, il 
existe un vecteur z, appartenant à l'intersection H. Supposons qu’il 
existe encore un vecteur z, € H. Mettons-le sous la forme 


21 — 20 + (z — Zo)- 
Maintenant la chaîne des relations 


Zis 20€ H 2, 20€ Hz, 20€ H: +2 — 20€ Li; 
72 —20E€EL: 7 —-7%E6L 


permet de conclure que tout vecteur de l'intersection H peut être 
représenté comme somme du vecteur z, et d’un vecteur de l’inter- 
section L. 

Soit ensuite f un vecteur arbitraire de Z. On a 


fEL—+fE Li; EL: +10 +fE EH; 20 +1E Hs: +20 +/1EH, 


c’est-à-dire tout vecteur du sous-espace L qui a été translaté suivant 
le vecteur z, appartient à l’intersection H. Le théorème est démontré. 
= Il n’est pas de rigueur qu’un plan soit un sous-espace. Néanmoins, 
on peut lui attribuer une dimension égale à celle du sous-espace direc- 
teur. Un plan de dimension nulle ne contient qu'un seul vecteur, le 
vecteur de translation. Pour définir la dimension d'une intersection 
des plans il est utile de recourir au théorème 19.1. Les théorèmes 
49.1, 45.1 entraînent que la dimension de l'intersection FH ne dépasse 
pas la plus petite des dimensions de Æ, et H.. 

Si dans un espace des segments orientés on donne deux (resp. 
trois) vecteurs, alors, sous quelques conditions supplémentaires, 
on peut construire un plan et un seul de dimension 1 (resp. 2) qui 
contiendrait les vecteurs donnés. Ces conditions supplémentaires 
peuvent être formulées de la façon suivante. Si on donne deux vec- 
teurs, ils ne doivent pas coïncider, c’est-à-dire ne doivent pas appar- 
tenir au même plan de dimension nulle. Si on donne trois vecteurs, 
ils ne doivent pas appartenir au même plan de dimension un. 

Des faits analogues ont lieu dans un espace vectoriel arbitraire. 

Soient Zos Ti - - -, TA des vecteurs dans un espace vectoriel. 
Disons que ces vecteurs sont dans la position générale s'ils n’appar- 
tiennent pas au même plan de dimension # — 4. 
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Théorème 45.2. Si les vecteurs xzo, z1, . . ., xx sont dans la 
position générale, il existe un plan unique H de dimension k qui con- 
lient ces vecteurs. 

Démonstration. Considérons les vecteurs zx, — zx,, 
Le — Lo» + + > Th — Lo. S'ils étaient linéairement dépendants ils 
appartiendraient à un sous-espace dont la dimension ne dépasserait 
pas k — 1. Les vecteurs xs, Z1, . . ., TA eux-mêmes appartiendraient 
donc au plan obtenu par translation de ce sous-espace suivant le 
vecteur z,, ce qui contredit l’hypothèse du théorème. 

Ainsi, les vecteurs z; — Zo, Ze — Tps - + -) Th — Zo Sont linéai- 
rement indépendants. Notons Z leur enveloppe linéaire. Le sous- 
espace Z est de dimension k. En le translatant suivant le vecteur 
z, nous obtenons un plan Æ de même dimension qui contient tous 
les vecteurs donnés Zo, Zy, - - ., Tr. 

Le plan Æ ainsi construit est unique. En effet, supposons que les 
vecteurs Zo, Zys + - +, Tr appartiennent chacun à deux plans X,, H, 
de dimension #. Un plan ne change pas si son vecteur de translation 
est remplacé par un autre vecteur du plan. Nous pouvons donc ad- 
mettre sans limiter la généralité que F,, H, s’obtiennent par trans- 
lations respectives des sous-espaces L;, L, suivant le même vecteur 
Zo. Or, ceci entraîne que les deux sous-espaces coïncident du fait 
que leur dimension est la même et qu'ils contiennent le même système 
vectoriel indépendant x; — Zo, Za — To, - - +, Th — To. 


Exercices 


1. Soient H,, H, deux plans quelconques. Appelons somme H, + H, des 
plans H\, H, l'ensemble des vecteurs de la forme :, + =, où z, € H;,:. É H. 
Montrer que la somme des plans est un plan. 

2. Soient 47 un plan et À un nombre. Appelons produit À H du plan H par 
le nombre À l'ensemble des vecteurs de la forme Àz, où : € 4. Montrer que ce 
produit est un plan. 

3. L'ensemble des plans d’un même espace muni des opérations sur ces 
plans introduites ci-dessus, est-il un espace vectoriel? 

4. Montrer que les vecteurs z4, z1, . .., x, Sont dans la position générale 
si et seulement si les vecteurs x, — ro, re — ro, - .- ., zx — ro sont linéaire- 
ment indépendants. 

5. Montrer qu'un plan de dimension # qui contient les vecteurs ro, x, . .. 

.., zx Se trouvant dans la position générale est un sous-espace si et seulement 
si ces vecteurs sont linéairement indépendants. 


$ 46. Droite et hyperplan 


Dans un espace vectoriel À de dimension m deux classes de plans 
jouent un rôle particulier. Ce sont les plans de dimension { et ceux 
de dimension m — 1. Conformément à l’image géométrique dans les 
espaces des segments orientés, tout plan de dimension 1 est appelé 
droite. Un plan de dimension m — 1 est appelé kyperplan. 

Considérons une droite arbitraire H dans un espace vectoriel X. 
Notons x, son vecteur de translation ; q un vecteur de base du sous- 
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espace directeur de dimension 1. Supposons que ces vecteurs soient 
donnés par leurs coordonnées 


Lo (28 su 2m) 
q — (Ga as - + -) Im) 
par rapport à une base de l’espace Æ. Tout vecteur : de la droite H 
peut évidemment être mis sous la forme 
Z = Zo + tq, (46.1) 


où £ est un nombre. On peut donc admettre que (46.1) soit une équa- 
tion vectorielle d’une droite Æ dans un espace X. Si dans la même 
base les coordonnées du vecteur z sont 


Z2 — (22 Zes - - Zm)» 
alors, en explicitant l'égalité (46.1) en coordonnées, on obtient 
Z1 = Ti + ga, 
22 = Ze + Got, (46.2) 


Zm = Im + Jmt- 


La comparaison de ces équations avec (43.10) et (43.11) suggère 
naturellement de leur donner le nom d'équations paramétriques 
d’une droite. Nous dirons que la droite passe par le vecteur zx, et 
que son vecteur directeur est q. 

D'après le théorème 45.2, par deux vecteurs distincts zo, Yo 
quels qu'ils soient on peut mener une droite et une seule. Supposons 
que dans une base de l’espace X, les vecteurs z,, y, soient donnés 
par leurs coordonnées 


Lo = (Zi Les + + +» Tm)) 
Yo — (Y1 Uss Ym)- 


Le vecteur directeur pouvant être, par exemple, le vecteur yo — xo, 
on tire de (46.2) les équations paramétriques 


24 = Zi + (y —zi)t, 
29 = Lo + (Ye — T2) l, (46.3) 


. ee + ee ee ee ee ee ee ee ee 


Zm = Tm+ (Ym — Tm) l 


d'une droite passant par deux vecteurs donnés. 

Pour t — 0 ces équations définissent le vecteur xz,, pour { — 1 
le vecteur y,. Si l’espace Æ est réel, l’ensemble des vecteurs donnés 
par les équations (46.3) pour 0 < t{ < 1 s'appelle segment joignant 
les vecteurs zo, yo. Evidemment, cette appellation est associée à 
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l’image géométrique de l’ensemble donné dans les espaces des seg- 
ments orientés. 

Supposons que la droite H coupe un certain plan. Alors, d’après 
le corollaire du théorème 45.1, l’intersection sera ou bien une droite, 
ou bien un seul vecteur. Si l’intersection est une droite, elle coïncide 
certainement avec la droite J. Mais cela signifie qu’en coupant le 
plan, la droite est soit complètement contenue dans ce plan, soit pos- 
sède avec lui un seul vecteur commun. 

La notion d’hyperplan est justifiée pour tout espace vectoriel, 
mais nous ne l’utiliserons que dans les espaces munis d’un produit 
scalaire. 

Considérons un hyperplan H arbitraire. Supposons qu'il soit 
engendré par translation d’un sous-espace Z de dimension m — 1 
suivant un vecteur z,. Le complément orthogonal L1 est dans ce 
cas un sous-espace à une dimension. Désignons par n l’un quelconque 
de ses vecteurs de base. Le vecteur z appartient à l’hyperplan X si 
et seulement si le vecteur z — x, appartient au sous-espace Z. À son 
tour, cette condition est respectée si et seulement si le vecteur z — x, 
est orthogonal au vecteur 7, c’est-à-dire si 


(n, z— ze) = 0. (46.4) 


Ainsi, nous avons obtenu une équation vérifiée par tous les 
vecteurs de l’hyperplan H. Pour qu'un hyperplan soit donné sous 
la forme d’une telle équation, il suffit d'indiquer un vecteur quel- 
conque x orthogonal au sous-espace directeur et un vecteur de trans- 
lation xo. | 

La forme explicite de l'équation permet de simplifier sensible- 
ment des études de toutes sortes. Supposons que soient donnés les 
vecteurs A, May + - «y Ph OÙ Ty, Lay + - «, Zn. Explorons le plan R, 
intersection des hyperplans 


(r4, Z — T4) == 0, 
(722, a— L2) — 0, 


(46.5) 


Ce problème peut être envisagé comme la résolution du système 
d'équations (46.5) par rapport aux vecteurs z. Supposons que l'in- 
tersection des hyperplans soit non vide, c’est-à-dire que le système 
(46.5) possède au moins une solution z,. Alors, comme on sait, le 
plan à chercher est également défini par le système 
(74, Z2— 20) = 0, 
(722, 3— 20) = Ù, (46.6) 


(UE Z — 2) — 0 
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du fait qu'un plan ne change pas si on remplace son vecteur de 
translation par un autre vecteur de ce plan. 

Le vecteur y — z — z, est un vecteur arbitraire de l'intersection 
L des sous-espaces directeurs de tous les À hyperplans. Il est évident 
que les vecteurs y du sous-espace Z satisfont au système suivant : 


(UTE y) — 0, 
ie (46.7) 
(r», y) = 0. 


La donnée de l'intersection ZL sous la forme d’un système (46.7) 
permet de trouver aisément la dimension de Z. Comme le montre le 
système lui-même, le sous-espace ZL est un complément orthogonal 
de l’enveloppe linéaire du système de vecteurs 7, R2, . . ., nn. Soit r 
le rang de ce système, alors la dimension de Z et, par conséquent, 
celle de À, est m — r, où m est la dimension de l’espace. En particu- 
lier, si les vecteurs n,, n:, . . ., nr, sont linéairement indépendants, 
la dimension du plan (46.5) est m — k. On suppose bien sûr, que le 
plan existe, c’est-à-dire que le système (46.5) possède au moins une 
solution. Pour donner le sous-espace Z défini par le système (46.7), 
il suffit d'indiquer sa base, c’est-à-dire un système de m — r vecteurs 
linéairement indépendants orthogonaux aux vecteurs 71, Re, - - ., Rp. 

L'équation (46.4) d’un hyperplan peut s’écrire autrement. 
Introduisons la notation (7, r,) — b; alors l'équation 


(n, 2) = b (46.8) 


définira le même hyperplan que (46.4). Constatons que les équations 
générales (43.3), (43.5) d’une droite et d’un plan sont au fond des 
équations de même type. Il importe de souligner que foute équation 
de la forme (46.8) peut être réduite à la forme (46.4) en choisissant 
convenablement le vecteur x,. À cet effet il suffit de prendre x 
sous la forme de 

Zo — ON. 


En portant cette expression dans (46.4) et en la comparant à (46.8), 
on déduit que 
b 
Un 
A présent nous pouvons conclure que si un système de la forme 
(46.5) définit un plan, ce plan peut être aussi bien défini par le 
système 
(4, 2) = di, 
(72; z) = D», 


(46.9) 


(rx, z) = br 
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avec les nombres b,, b,, ..., b,; convenables. La réciproque est 
également vraie. Pour des vecteurs x, z+, . . ., z, Convenables le 
système (46.5) définit le même plan que le système (46.9). 

Les droites et les plans sont des hyperplans respectivement dans 
les espaces V, et V,. Nous avons établi plus haut la liaison qui existe 
entre la distance d'un point à un hyperplan de ce genre et le résul- 
tat de la substitution des coordonnées d’un point dans l'équation 
générale d’un hyperplan. Une liaison analogue a lieu dans le cas 
d'un hyperplan arbitraire. 

Soit À un hyperplan donné par l'équation (46.4). De même 
qu'auparavant, notons p (v, H) la distance entre le vecteur v et H. 
En tenant compte de l'équation (46.4), on obtient 


(n, U — Zo) = (nr, U — Zo) — (7, Z — 0) 7 (n, U — 2) 
pour tout vecteur z de . D’après l'inégalité de Cauchy-Bouniakovski 
[{v—z)|<In|lv—zl]. (46.10) 


Donc 
1 If v—2zo)| 
Lu PT mes 
Si nous montrons que l’hyperplan Æ possède un vecteur z* et un 
seul tel que l'inégalité (46.10) devienne égalité, nous prouverons 
d’abord que 
p (v, 4)= et (46.11) 
et puis, que la valeur de p (v, H) n’est réalisée que sur le vecteur z*. 
Désignons par ZL le sous-espace directeur de l’hyperplan À. Il 
est clair que tout vecteur orthogonal à L sera colinéaire à n et inver- 
sement. L’inégalité (46.10) devient égalité si et seulement si les 
vecteurs r et vu — z sont colinéaires, c’est-à-dire si v — z — an pour 
un certain nombre a. Supposons que l'égalité ait lieu pour deux 
vecteurs z, et z. de H, c'est-à-dire 


U — Z, = A, 
U — Ze —= an. 


Il s'ensuit que 
Z1 — 22 = (ae — QG) n. 


Par conséquent, z, — z: 1 L. Mais z, — z, € L en tant que diffé- 
rence de deux vecteurs d’un hyperplan. Aussi, 2, — z: — O ou 
21 — Ze. 

Notons z, le vecteur de H orthogonal à L. Nous savons déjà que 
ce vecteur existe et qu’il est unique. Mettons le vecteur z sous la 
forme 


Z = Zo + ÿ; 
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où y € L. Mettons le vecteur v sous la forme 
v=f+s, 
où fEL, s 1 L. À présent 
U—z—=(S— 20) + (f — y). 
Si l’on prend z = Zo + f, il vient 
U— Z = S — Zo- 


Le vecteur kÀ — s — z, est orthogonal à Z et nous avons ainsi établi 
la formule (46.11). 

Nous avons montré en même temps que tout vecteur v de l’espace 
peut être mis d’une façon unique sous la forme de la somme 


vV—=Zz+h, 


où le vecteur z appartient à l’hyperplan Æ et le vecteur h est ortho- 
gonal au sous-espace directeur L. Par analogie avec les espaces des 
segments orientés, le vecteur z de ce développement s'appelle pro- 
jection du vecteur v sur l’hyperplan X, h la perpendiculaire abaissée 
du vecteur v sur H. Si un hyperplan est donné par l'équation (46.4), 
on dit que le vecteur x est le vecteur rormal de l’hyperplan. Pour 
deux vecteurs x, et rz donnés il existe un seul hyperplan qui contient 
le vecteur x, et qui est orthogonal au vecteur n. 


Exercices 


1. Montrer que tout plan distinct de l’espace tout entier peut être donné 
comme une intersection (46.9) d’'hyperplans. 

2. Montrer que la somme des hyperplans est un hyperplan si et seulement 
si les hyperplans additionnés sont parallèles. 

3. Montrer que le produit d'un hyperplan par un nombre non nal est un 
byperplan. 

. . Quelles sont les conditions du parallélisme d’une droite et d’un hyper- 

plan 

5. Déduire la formule de la distance entre un vecteur et une droite donnée 
par l'équation (46.1). 


$ 47. Demi-espace 


Aux notions de droite et d'hyperplan est étroitement liée la 
notion d'ensemble convexe. Comme de tels ensembles sont large- 
ment utilisés dans les branches les plus diverses des mathématiques, 
nous allons étudier certains d’entre eux. 

Un ensemble des vecteurs d’un espace vectoriel réel est dit 
convexe si avec chaque couple de ses vecteurs il contient le segment 
tout entier qui les joint. 

Un vecteur, un segment, une droite, un sous-espace, un plan, 
un hyperplan, sont entre autres des exemples d’un ensemble convexe. 
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Supposons que dans un espace réel un hyperplan soit donné par 
l'équation | 


(n, z) — b = 0. 
L'ensemble des vecteurs z qui vérifient l'inégalité 

(n, 2) —b<O0 (47.1) 
ou 

(n, 2} —b>0 (47.2) 


s'appelle demi-espace ouvert. Le demi-espace (47.1) est dit négatif, 
le demi-espace (47.2) positif. 
Théorème 47.1. Un demi-espace est un ensemble convexe. 
Démonstration. Prenons deux vecteurs xz,, y, et notons 


®; — (n, To) — bd, D, — (r, Yo) — b. 


Si z est un vecteur quelconque d'une droite passant par ze, ÿo, il 
vient 


2 = Zo + À (Yo — Lo)- 


Pour 0 < # < 1 on obtient les vecteurs du segment qui joint x,, Yo. 
On a 


mn, 2 —b=@, (1 — 1) + Dit. (47.3) 


Si D, et ®, sont de même signe, c’est-à-dire si les vecteurs zy, Yo 
appartiennent au même de i-espace, alors le second membre de la 
relation (47.3) a le même signe pour toutes les valeurs de £ vérifiant 
les inégalités 0 < 1 < 1. 

Ainsi, tout hyperplan partage un espace vectoriel en trois en- 
sembles convexes disjoints qui sont l’hyperplan lui-même et deux 
demi-espaces ouverts. 

Supposons que les vecteurs xs, y, appartiennent aux demi-espaces 
différents, c’est-à-dire les signes de ©, et de ®, sont différents. Une 
transformation formelle de la relation (47.3) amène l'égalité 


1 
(n, z) — b — (D, — Dj) (1555) ® 
Il s'ensuit qu’une droite passant par les vecteurs x,, y, Coupe l'hyper- 
plan. L’intersection est définie par la valeur 


1 


= Go, 


qui satisfait aux inégalités 0 < £ < 1. Résumons: | 

Si deux vecteurs appartiennent à des demi-espaces différents, le 
segment qui joint ces vecteurs coupe l'hyperplan qui définit ces demi- 
espaces. 
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Si l’on tient compte de la propriété énoncée, on comprend facile- 
ment ce que sont les demi-espaces dans les espaces des segments 
orientés. Dans un plan, les extrémités des vecteurs d'un demi-espace 
sont du même côté d’une droite, dans l’espace, ils sont du même 
côté d'un plan. 

L'étude des demi-espaces ouverts s'accompagne souvent de celle 
des demi-espaces fermés. Un demi-espace fermé est défini comme 
un ensemble des vecteurs z qui satisfont à l'inégalité 


(nr, 2) —b<0 (47.4) 
‘OU 
(n, 2) —b>0. (47.5) 


Le demi-espace (47.4) est dit ron positif, le demi-espace (47.5) est 
dit non négatif. Bien sûr, les demi-espaces fermés sont également 
des ensembles convexes. 

Théorème 47.2. L'intersection des ensembles convexes est 
un ensemble convexe. 

Démonstration. Il est évident qu'il suffit d'examiner le 
cas de deux ensembles U,, U.. Soit U — U, f\ VU, leur intersection. 
Prenons deux vecteurs quelconques z,, y, de U et notons $ le segment 
qui les joint. Les vecteurs x,, y, appartiennent tant à U, qu'à U.. 
C'est pourquoi, en vertu de la convexité des ensembles U,, U., 
le segment S appartient complètement tant à U, qu’à U., c'est-à-dire 
à l'intersection U. 

L'intérêt de ce théorème pour l’étude des ensembles convexes 
est très grand. En particulier, il permet d'avancer que l’ensemble 
non vide des vecteurs z qui vérifient simultanément le système des 
inégalités 

(74, z)— f1 Z O, 
(n2, Z)— 2 & 0, 


(7%, Z)— fr Z 0 


est convexe. De tels systèmes d’inégalités constituent un élément 
essentiel de la description de nombreux problèmes dans les domaines 
de la planification, de la gestion, etc. 


Exercices 


1. Montrer qu’un ensemble des vecteurs z vérifiant la condition (z, z) < a& 
est un ensemble convexe. 

2. Montrer que si un vecteur z est contenu dans un hyperplan (46.8), le 
vecteur z: + n appartient, lui, à un demi-espace positif. 

3. Montrer que si un hyperplan est donné par les équations normées (44.1) 
ou el l'origine des coordonnées appartient toujours au demi-espace non 
positif. 
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$ 48. Systèmes d’équations linéaires 


Nous revenons à l'étude des systèmes d'équations linéaires al- 
gébriques, mais cette fois nous l’associons au problème de l’inter- 
section des hyperplans. 

Considérons l’espace réel ou complexe X de dimension m. Suppo- 
sons qu’on y ait introduit un produit scalaire. Choisissons l'une 
quelconque des bases orthonormées et supposons que les vecteurs 
NOTMAUX Nys les + + - Rx des hyperplans H,, H., ..., H} de (46.9) 
soient donnés par leurs coordonnées 


Ni — (CITE Aÿ9s Gim); 


No = (G21, Ag2y Zom); 


Nh —= (ani Ahpgs Gnm) 


(48.1) 


relatives à cette base. Admettons que les vecteurs 


Z — (21 Z9s © 25), 


qui appartiennent à l'intersection des hyperplans soient donnés égale- 
ment par leurs coordonnées dans la même base. 

Dans le cas d’un espace réel le produit scalaire des vecteurs dans 
une base orthonormée est égal à la somme des produits deux à deux 
des coordonnées. C’est pourquoi le système (46.9) exprimé en coor- 
données correspondantes sera de la forme 


Gy12s + 1222 + + + + + GimZm = V1; 


A2424 + Co222 + - . . + ArmZm = Da, (48.2) 


Gp121 + AR222 + + + + Cpm2m = Or. 


Dans le cas d’un espace complexe nous avons encore un système 
analogue, seuls les coefficients affectés aux inconnues et les seconds 
membres sont remplacés par des nombres complexes conjugués. 

Ainsi, le problème de l'intersection des hyperplans se ramène à 
la résolution d’un système d'équations linéaires algébriques décrit 
au $ 22. Il est évident que tout système d'équations à coefficients 
complexes ou réels peut être considéré du point de vue de l’intersec- 
tion des hyperplans dans un espace complexe ou réel P,.. 

L'un des points essentiels est l'étude de la compatibilité d'un 
système d'équations linéaires algébriques. C'est précisément cette 
caractéristique qui répond à la question si l'intersection des hyper- 
plans est un ensemble vide ou {non. Bien sûr, pour l’établir, on 
peut appliquer la méthode de Gauss. Or, cette méthode n’est pas 
toujours commode. 
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Four étudier un système d’quations linéaires on fait appel à deux 
matrices. L'une d'elles se compose de coefficients affectés aux incon- 
nues ; on l’appelle matrice du système : 


di 9 -. . Aim 


Ahs Œh2 - +. pm 
L'autre se déduit en ajoutant la [colonne des seconds membres : 


Gji A2 ++. Gym O4 


on l'appelle matrice complète du système. Notons en particulier que 
le rang de Ja matrice du système coïncide avec celui du système de 
vecteurs (48.1). 

Théorème 48.1 (théorème de Kronecker-Capelli). Pour qu'un 
système d'équations linéaires algébriques soit compatible, il faut et 
il suffit que le rang de la matrice complète soit égal à celui de la 
matrice du système. 

. Démonstration. Reprenons les notations du $ 22. Les 
vecteurs @, os .« - <, Am SOnt les colonnes des matrices envisagées. 
Le rang d’une matrice coïncidant avec celui du système de ses vec- 
‘teurs colonnes, pour prouver le théorème il suffit de montrer que le 
système est compatible si et seulement si le rang du système 
Œj, Zos + + + Am COIÏnCide avec celui du système a, @, . . ., Am, d. 

Supposons que le système (48.2) soit compatible. Cela signifie 
que l’égalité (22.1) est respectée pour une certaine collection de 
nombres 2,, Ze, . . ., 2m, C'est-à-dire que le vecteur b est une com- 
binaison linéaire des vecteurs &;, &, . . ., Am. On en tire que toute 
base du système a, @o+, . . ., Am Sera en même temps une base du 
système d;, Go, . . ., Am) 0, C'est-à-dire que les rangs des deux systè- 
mes coïncident. 

Supposons maintenant que les rangs de ces systèmes coïncident. 
Choisissons une base dans &, &:, . . ., Am. Elle sera aussi une base 
du système a;, @s, . . ., Am, 0. Par conséquent, le vecteur b s'exprime 
linéairement par une partie des vecteurs du système a,, &:, . . ., Am. 
Puisqu'il peut être représenté également comme combinaison li- 
néaire de tous les vecteurs a, &:, . . ., 4m, le système (48.2) est com- 
patible. Le théorème est démontré. 

Le système d'équations linéaires algébriques (48.2) est dit non 
homogène si les seconds membres sont non tous nuls. Dans le cas 
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contraire le système est homogène. Tout système homogène est 
toujours compatible du fait que l’une de ses solutions est z, — 
= 2: =... —= 2m —= 0. Le système obtenu à partir de (48.2) en 
substituant les zéros aux seconds membres, s'appelle système homo- 
gène associé au système (48.2). Si (48.2) est compatible, chacune de 
ses solutions est appelée solution particulière. La collection de toutes 
les solutions particulières se nomme solution générale du système. 

Forts des renseignements obtenus dans ce qui précède sur les 
plans et les systèmes (46.6), (46.7), (46.9) qui décrivent les inter- 
sections des hyperplans, nous pouvons tirer plusieurs conclusions 
relatives à la solution générale d’un système d'équations linéaires 
algébriques. 

La solution générale d’un système homogène associé constitue dans 
l'espace P,, un sous-espace de dimension m — r, où r est le rang de la 
matrice du système. Toute base de ce sous-espace s’appelle système 
fondamental de solutions. 

La solution générale d'un système non homogène est un plan dans 
l’espace P», obtenu par translation de la solution générale du système 
homogène associé suivant n'importe quelle solution particulière du. 
système non homogène. 

La différence entre deux solutions particulières quelconques d'ur 
système non homogène est une solution particulière du système homogène 
associé. 

Parmi les solutions particulières d'un système non homogène il 
n'y a qu’une seule solution orthogonale à toutes les solutions du système 
homogène associé. Cette solution s'appelle normale. 

Pour qu'un système compatible possède une solution unique, il faut 
et il suffit que le rang de la matrice du système soit égal au nombre des 
inconnues. 

Pour qu'un système homogène ait une solution non nulle, il faut 
et il suffit que le rang de la matrice du système soit inférieur au nombre 
des inconnues. 

En étudiant les systèmes d'équations linéaires nous n’avons 
utilisé que par le biais la notion de déterminant, surtout par l’in- 
termédiaire de celle de rang d’une matrice. Or, dans la théorie des 
systèmes d'équations le rôle du déterminant est bien plus grand. 

Supposons que la matrice du système soit une matrice carrée. 
Pour que son rang soit inférieur au nombre des inconnues, il faut 
et il suffit que le déterminant du système soit nul. Donc,i 

Un système homogène possède une solution non nulle si et seulement 
si le déterminant du système est nul. 

Supposons maintenant que le déterminant du système soit dif- 
férent de zéro. Cela signifie que le rang de la matrice du système 
est m. Le rang de la matrice complète ne peut être inférieur à m. 
Mais il ne peut pas non plus être plus grand que m du fait que les 
mineurs d'ordre m + 1 n'existent pas. Par suite, les rangs des deux 
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matrices sont égaux, donc le système est bien compatible. De plus, 
sa solution est unique. On en tire que 

Si le déterminant d'un système est différent de zéro, Le système possède 
toujours une solution et une seule. 

Du point de vue de l'intersection des hyperplans, ce fait peut 
être énoncé de la façon suivante: 

Si les vecteurs normaux des hyperplans forment une base de 
l’espace, l'intersection des hyperplans n’est pas vide et contient 
un seul vecteur. 

Désignons par d le déterminant du système, par d; le détermi- 
nant distinct de d seulement par sa j-ième colonne remplacée par 
la colonne des seconds membres b,, b:, . .., b,. La solution unique 
du système peut être calculée alors d’après les formules 

= j=1, 2 un. (48.3) 


En effet, notons À;; le cofacteur de l'élément a;; du déterminant 
du système. En développant d; suivant la j-ième colonne, on obtient 


n 
d; = 2 biA;je 


Portons maintenant les expressions (48.3) dans la k-ième équation 
du système 


D'après (40.5), (40.8) la somme interne de la dernière égalité est 
égale soit à d, soit à zéro suivant que i = koui Æk. 

Ainsi, les formules (48.3) donnent une expression explicite de 
la solution du système par ses éléments. L’unicité fait qu’il n’existe 
aucune autre solution. Ces formules s'appellent formules de Cramer. 

D'un point de vue formel le calcul des déterminants permet de 
résoudre tout système d'équations de la forme (48.2). D'abord en 
calculant les divers mineurs de la matrice du système et de la matrice 
complète, nous vérifions la compatibilité du système. Supposons 
qu'elle soit compatible et que le rang des deux matrices soit r. 
Sans limiter la généralité, on peut admettre que le mineur principal 
d'ordre r de la matrice du système est différent de zéro. D'après 
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le théorème 41.1, les dernières À — r lignes de la matrice complète 
sont des combinaisons linéaires de ses premières r lignes. Par consé- 
quent, le système 

GyaZs +... + Gir2ri + 4, r442r44 + + + + + GimZm = 4, 

Qui t + . À Gor2r iQ, r2r+s À + + + + G2m2m — D, (48.4) 


est équivalent au système (48.2). 

De même que dans ce qui précède, les inconnues 2,4,, . . ., 2m 
sont dites libres. En leur affectant des valeurs quelconques, on peut 
définir également toutes les autres inconnues et résoudre le système 
à matrice du mineur principal, par exemple, d’après les formules 
de Cramer. 

Cette méthode ne présente un certain avantage que pour des 
recherches théoriques. Quant au domaine pratique, il est beaucoup plus 
commode d’utiliser la méthode de Gauss décrite au $ 22. 


Exercices 


4. Montrer qu'une solution générale est un ensemble convexe. 

2. Montrer que parmi toutes les solutions particulières d’un système non 
homogène, la solution normale est la moins longue. 

3. Montrer qu'une collection de m — r solutions du système homogène 
associé telles que le déterminant composé de valeurs des inconnues libres soit 
différent du zéro, est un système fondamental. 

4. Nous avons dit au $ 22 que de petits changements des coordonnées peu- 
vent compromettre la dépendance ou l'indépendance linéaires des vecteurs. 
Quelles sont les conclusions qu’on peut en tirer par rapport au problème de 
l'intersection des hyperplans? 


CHAPITRE 6 


LIMITE DANS UN ESPACE VECTORIEL 


$ 49. Espace métrique 


L'une des notions essentielles de l’analyse mathématique est 
celle de 1a limite. Elle est fondée sur le fait que pour les points de 
l'axe numérique la notion de la « proximité » ou, plus précisément, 
de la distance entre les points est définie. 

La « proximité » peut servir également pour comparer des en- 
sembles de tout autre nature. Nous avons déjà défini au $ 29 la dis- 
tance entre les vecteurs d'un espace vectoriel muni d’un produit 
scalaire. Nous avons établi que ses propriétés (29.5) sont les mêmes 
que celles dela distance entre les points de l’axe numérique. La 
distance entre les vecteurs a été déterminée à l’aide d’un produit 
scalaire qui, à son tour, avait été introduit axiomatiquement. 

Il est naturel de chercher à définir axiomatiquement la notion de 
la distance elle-même en lui imposant les propriétés (29.5). 

Constatons que dans l'analyse mathématique de nombreux faits 
fondamentaux de la théorie des limites ne sont pas liés aux opéra- 
tions algébriques sur les nombres. Aussi, commençons-neus en éten- 
dant la notion de la distance aux ensembles arbitraires dont les 
éléments ne sont pas nécessairement des vecteurs des espaces vec- 
toriels. 

Un ensemble s'appelle espace métrique si à tout couple de ses 
éléments on fait correspondre un nombre réel non négatif appelé 
distance, tout en respectant les axiomes suivants: 

1. p (zx, y) = 0 (y, x), 

2. px, y) >0, si z y; pr, y) =0, si z = y, 

*3. p(z, y) LP (x, 2) + p (2, y) 
quels que soient les éléments zx, y, z. Ces axiomes sont dits de la 
métrique, le premier d’entre eux étant celui de la symétrie et le 
troisième étant appelé irnégalité triangulaire. 

Formellement, tout ensemble dans lequel est définie une relation 
d'égalité peut être transformé en espace métrique si l’on pose 


0, si z=y, 


Peuple (49.1) 
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On vérifie aisément que tous les axiomes de la métrique sont res- 
pectes. 

Le vecteur zx, d’un espace métrique X est appelé limite d’une 
suite {z,} des éléments z,, ze, . . ., zh, . . . de X, si la suite des dis- 
tances P (Zo, T1), P (To, Ta), - + ., P (To Tn), - . . CONvVerge vers zéro. 
Ecrivons dans ce cas 


In 7 Lo 
ou 
lim zx, =%X 
ñn—00 


et appelons la suite {x,} convergente dans X ou tout simplement 
convergente. 

Remarquons qu'une même suite d'éléments d’un même ensemble 
X peut être convergente ou divergente en fonction de la métrique 
introduite dans X. Supposons, par exemple, que dans l’espace métri- 
que X il y ait une suite convergente quelconque {z,} composée 
d'éléments distincts deux à deux. Changeons la métrique de X en 
l’introduisant d'après (49.1). Maintenant la suite {x,} ne sera plus 
convergente. En effet, supposons que z,—7x,, c'est-à-dire 
P (zx, 2) — 0. Pour la nouvelle métrique ceci n’est possible que si 
tous les éléments de {z,} à l'exception d’un nombre fini d’entre 
eux, coincident avec z;. Cette réduction à l'absurde confirme la 
proposition énoncée. 

Toutes les suites convergentes possèdent les deux propriétés 
suivantes. 

Si une suite {xr,} est convergente, toute sous-suite qu'elle con- 
tient converge et possède la même limite. Une suite ne peut avoir 
plus d’une limite. 

La première propriété est évidente. Supposons qu'une suite 
{z } possède deux limites x, et y,. Alors, pour tout nombre & >> 0 
aussi petit que l’on veut on peut choisir un W tel que 


[A : 
p (Zo: Tn)< D 9 P (Yo: En) a 
pour tout rz >> N. Or, en utilisant l'inégalité triangulaire on en tire 


P (Zor Yo) < P (Lo: Zn) + P (Zns Yo) < &. 


eg étant arbitraire, cela signifie que p (zo, Yo) = 0, c'est-à-dire que 
To — Yo- 

Dans un espace métrique X on appelle boule S (a, r) l’ensemble 
des éléments x € X qui vérifient la condition 


p (a, z)<<r. (49.2) 


L'élément a est appelé centre de la boule, le nombre r son rayon. 
Toute boule de centre a s'appelle voisinage de l'élément a. Un ensem- 
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ble des éléments est dit borné s’il appartient tout entier à une cer- 
taine boule. 

On voit aisément qu’un élément zx, est la limite d'une suite {x,} 
si et seulement si tout voisinage de l'élément zx, contient tous les 
éléments de la suite envisagée à partir d’un certain indice. 

Dans un espace métrique on peut introduire également bien 
d’autres notions importantes relatives aux ensembles numériques. 
Ainsi, si l’on a un ensemble M € X, un élément x € X s'appelle 
point limite de cet ensemble si tout voisinage de l’élément x contient 
au moins un élément de l’ensemble M qui ne se confond pas avec x. 
L'ensemble obtenu par l’adjonction à M de tous ses points limites 
est appelé fermeture de l’ensemble M notée M. Un ensemble } est 
dit fermé si M = M. 

Examinons les points limites de la boule (49.2). Montrons qu'ils 
satisfont tous à la condition 

p(a, z)<r. (49.3) 
En effet, supposons qu’il existe au moins un point limite x’ de la 
boule (49.2) tel que p (a, zx’) > r. D’après la définition du point 
limite, tout voisinage de l’élément zx’ doit contenir au moins un 
élément de la boule (49.2) qui ne coïncide pas avec zx’. Mais le voisi- 
nage de rayon 0,5 (p (a, zx') — r) ne contient aucun de tels éléments. 
Donc 

Un ensemble S (s, r) des éléments x qui satisfont à la condition 
(49.3) est appelé boule fermée. 


Exercices 


1. Montrer que Si zh —+ 7, alors p (zh, :) + p (x, z) pour tout élément z. 
2. L'ensemble des nombres réels sera-t-il un espace métrique si on pose 
pour les nombres zx, y 
p (x, y) = arctg|z—yl? 
3. Un ensemble composé d'un nombre fini d'éléments peut-il posséder 
des points limites? 


$ 50. Espace complet 


On dit qu’une suite {r,} des éléments d’un espace métrique est 
une suite de Cauchy si pour tout & > 0 il existe un entier N tel que 
P (Zn, Tm) < e pour nr, m >N. 

Toute suite de Cauchy est bornée. En effet, d'après e donné choi- 
sissons N conformément à la définition et prenons un entier arbitrai- 
re ro >> N. Tous les éléments de la suite à partir de x, appartiennent 
à la boule de centre z,, et de rayon €. Quant à tous les éléments, 
ils appartiennent à la boule de centre 7,, et de rayon égal au plus 
grand des entiers 


E, P(Ts Tne) ee, P (Zno—1 Tno) 
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Si une suite est convergente, c’est une suite de Cauchy. Soit 
{z,} une suite convergente vers z,. Alors, pour tout & > 0 il existe 
un entier W tel que 


P (Zn, Lo) <+ 
pour n >> N. D'après l'inégalité triangulaire, on a 
P (Zn: Tm) < P (Zn; To) + p (o, Tm) < € 


pour nr, m> AN, ce qui traduit que la suite {x,} est une suite de 
Cauchy. 

Pour l’ensemble des nombres réels la réciproque est également 
vraie. Notamment, toute suite de Cauchy est convergente. Pourtant, 
dans le cas général, ceci n’est déjà plus vrai, fait confirmé par l’exem- 
ple d’un espace métrique d’où on a éliminé au moins un point limite. 

Un espace métrique est dit complet si dans cet espace toute suite 
de Cauchy est convergente. 

Les espaces métriques complets vérifient un théorème analogue 
au théorème des segments emboîtés des nombres réels. Soit une 
suite de boules. Appelons ces boules emboîtées si chaque boule sui- 
vante est contenue dans la boule précédente. 

Théorème 50.1. Soit dans un espace métrique complet X 
une suile {S (a,, en)} des boules fermées emboïtées. Si la suite des 
rayons tend vers zéro, il existe dans X un élément unique qui appartient 
à toutes ces boules. 

Démonstration. Considérons la suite {a,}. Puisque 


S (an+p); En+p© S (an, 2) pour tout p > 0, il vient a,+, € S S (an, En). 
Par conséquent, 


P (Gn+p) an) < < En ’ 


d’où il résulte que la suite {a, } est une suite de Cauchy. 

L'espace X est complet, la suite {a,} converge donc vers une 
certaine limite a de X. Choisissons une boule quelconque $ (a,, ex). 
À cette boule appartiennent tous les termes de la suite {a, } depuis 
ar. Les boules étant fermées, la limite de la suite donnée appartient 


également à S (ax, ex). Ainsi, a appartient à toutes les boules. 
Supposons ensuite qu’il existe un autre élément b, qui appartient 
lui aussi à toutes les boules. D’après l’inégalité aa on à 


p (a, b) < P (a, an) + P (an, b) < 


Puisque &, peut être aussi petit que l’on veut, cela signifie que 
p (a, b) = 0, c’est-à-dire a = b 

L'ensemble des nombres réels et celui des nombres complexes pré- 
sentent les exemples les plus importants des espaces complets. Nous sup- 
posons ici que la distance entre les nombres coïncide avec le module 
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de leur différence. La complétude de l’ensemble des nombres réels 
est démontrée dans l’analyse mathématique. Prouvons la complétude 
de l’ensemble des nombres complexes. 

Admettons que les nombres complexes soient donnés sous une 
forme algébrique. La distance entre les nombres 


z=a<+ib, v—=c<+id 
est introduite d’après la loi 
p(z vw =[z—vl, (50.1) 


« 


où 
[z—v = (a — c)° + (b — d)°. (50.2) 


Il est évident que les axiomes de la métrique sont respectés. 
Examinons une suite {z, — ax + ib,} des nombres complexes. 

Supposons que cette suite soit une suite de Cauchy. D'après e > 0 

donné cherchons un entier V tel que pour tous 7, m > N on ait 


| Zn Fe Zm l << £. 
(50.2) entraîne alors que 


lan — 4m | < &, lon — bm | << e, (50.3) 


c'est-à-dire que les suites {a;,} et {b,} sont elles aussi des suites de 
Cauchy. L'ensemble des nombres réels étant complet, il existe des 
nombres a, b tels que 


az > €, D: —+ 0. 
En passant à la limite dans les inégalités (50.3), on obtient 


[an — a | < 85 [bn — bI< e. 
Désignant 
z = a + ib, 
nous avons , 
p (zn, 2) < V 2e 


pour tout n > N. Mais cela signifie que la suite de Cauchy {z,} est 
convergente. 

A titre de corollaire constatons qu’une suite {2, — ax + ib4} 
converge vers un nombre z = a + ib si et seulement si les suites 
{a:} et {b,} convergent respectivement vers les nombres a et b. 

L'espace complet des nombres complexes possède bien des traits 
communs avec l’espace des nombres réels. En particulier, toute suite 
bornée des nombres complexes possède une sous-suite convergente. 
En effet, cette proposition est valable pour toute suite bornée des 
nombres réels. Il est ensuite évident qu'une suite Ga — Gp + ib»} 
étant bornée, les suites {a,} et {b,} le sont aussi. Puisque la suite 
{a,} est bornée, elle possède une sous-suite convergente {a,}. Exa- 
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minons la suite {b., }. Elle est bornée et possède donc aussi une sous- 

suite convergente {b,, }. Il est clair que {a, } sera une suite con- 

vergente. Par conséquent, la sous-suite {zv, est également con- 
P 

vergente. 

Par analogie avec l’espace des nombres réels, on introduit dans 
l’espace des nombres complexes la notion de suite infiniment grande. 
Plus précisément, une suite {z,} est dite infiniment grande si pour 
un nombre À aussi grand que l’on veut on peut indiquer un À tel que 
pour tout 4 => N on a l'inégalité | z, | > À. Il est évident que de 


toute suite non bornée on peut toujours extraire une sous-suite 
infiniment grande. 


Exercices 
1. L'ensemble des nombres réels sera-t-il un espace complet si on pose 
pour les nombres x, y 
p (x, y) = arctg|z —yl? 
2. Montrer que tout ensemble fermé d'un espace complet est lui-même 
un espace complet. 


3. Un ensemble fermé d'un espace métrique arbitraire sera-t-il nécessaire- 
ment un ensemble complet? 


4. Construire un exemple de métrique tel que l’ensemble des nombres 
complexes ne soit pas un espace complet. 


$ 51. Inégalités auxiliaires 


Etablissons certaines inégalités que nous allons utiliser dans 
l'exposé qui suit. Fixons un nombre positif arbitraire & et examinons 
la fonction exponentielle y = a* 

(fig. 51.1). Soient zx,, z, deux nom- yat 
bres réels différents. Menons une droite ÿ 
par les points de coordonnées (x,, a*), 
(ze, &*2). En tenant compte des pro- 
priétés de la fonction, nous voyons que 
les points de son graphique sur le seg- 1 | 
ment Î[z;,x.l reposent pas plus haut 
que la droite construite. | 
Soient maintenant zx, = 0, x, = 1. 


£ 


L'équation de la droite examinée est y J T 
alors y —ax<+(1—1zx). Par conséquent, 
a* << ax + (1 x) (51.1) Fig. 51.41, 


pour 0OLr<1. 
Appelons deux nombres positifs p, q conjugués s'ils satisfont à 
la relation 


+=. (51.2) 
Il est clair que p, q > 1. 


472 LIMITE DANS UN ESPACE VECTORIEL (CE. 6 


Pour n'importe quels nombres positifs a, b le nombre arPb-f sera 
également positif et on peut le choisir pour & de (51.1). Si l’on admet 
que x = pl, alors 1—zx—g'. Maintenant (51.1) implique 
l'inégalité suivante 

aP bq 

DE + 
pour a, b positifs quelconques et pour p, qg conjugués. Il est évident 
qu’en fait, cette inégalité a lieu pour tous les a, b non négatifs. 

Examinons deux vecteurs arbitraires z, y qui appartiennent à 
l’espace À, ou C,. Supposons qu'ils soient donnés par leurs coordon- 
nées 

LT, LS 2:25: 12) 
Y = (Vis Yes + + +» Un)- 


Etablissons ce qu’on appelle inégalité de Hôülder : 
D Iran IS(D In P) 7 (2 ul)". (51.4) 
R=1 Rk=1 R= 1 


Constatons que si parmi les vecteurs z, y il y a au moins un 
vecteur nul, l’inégalité de Hô6lder est immédiate. C’est pourquoi 
on peut se borner à zx Æ0 et y 0. Supposons que l'inégalité soit 
observée pour des vecteurs non nuls x, y quelconques. Alors, il en 
sera de même des vecteurs Àr, uy, quels que soient À, u. Il suffit 
donc de la démontrer pour le cas où 


D inP= D |ul=1 (51.5) 
k=1 k= 
En posant maintenant dans l'inégalité (51.3) «a = | zx |, b = | ya |, 


et en effectuant la sommation sur k de 1 à z, on obtient, compte tenu 
de (51.2), (51.5): 


2 ra |<14 
Mais ceci est précisément l’inégalité de Hôlder pour le cas (51.5). 

Démontrons maintenant l'inégalité de Minkowski qui signifie 
que pour n'importe quels vecteurs zx, y de À, ou C; 


ds 1/p LL 1/? Les 1/p 
(D rx +unl) (D za) +(X Il) (51.6) 
K=1 fi 1 


pour tout p > 1. 

L'inégalité de Minkowski est évidente pour p = 1, car le module 
de la somme de deux nombres ne dépasse pas la somme de leurs 
modules. De plus, elle est bien vraie si au moins l’un des vecteurs 


+ 
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est nul. C’est pourquoi nous pouvons nous borner à l’examen du 
cas p > 1 et zx 0. Ecrivons l'identité 


(lal+1bD=(lel+1b)*lal+(lel+1bDr "181. 


En y posant a = x}, b = y, et en sommant par rapportàkdeiàän, 
on obtient 


à (| 2x + | ya)? = 2 (ENEAEZ D a+ 2 an [+ lun Dune 


R= 


« 


Appliquons à chacune des deux sommes du second membre de 
cette relation l'inégalité de Hôlder. Si l’on tient compte de (p — 1) g9= 
= p, on obtient 


ñn 


2 (a+ P< 


k= 
Le ANUPTES PP [+ p\i/P 
SX (zxl+ lu) (CD IP) +2 Qu lP)"?), 
k=1 k=1 k=1 
Après avoir divisé les deux membres de l’inégalité par 


CZ (zxl+ lg D?) 
Rk=!{ 


on trouve que 


(2 (za | +1 ya pr) ?<( DRET p)"?+ (2 | Yr p)"?, 


k=1 
ce qui conduit immédiatement à l'inégalité (51.6). 


Exercices 


1. Déduire l'inégalité de Cauchy-Bouniakovski de l'inégalité de Hôlder. 
2. Etudier l'inégalité de Hôlder pour p —+ co. 
3. Etudier l'inégalité de Minkowski pour p —+ oo. 


$ 52. Espace normé 


Nous avons abouti à la notion de l'espace métrique en fixant 
notre attention sur une seule des propriétés d’un ensemble, sur celle 
de l'existence d’une distance. D’une façon analogue, en fixant notre 
attention sur les opérations dont est muni un ensemble, nous avons 
abouti à la notion de l’espace vectoriel. Maintenant nous allons 
étudier les espaces vectoriels munis de métrique. 

Il est évident que si la notion de la distance n’est liée d'aucune 
façon aux opérations sur les éléments, il est impossible de construire 
une théorie étoffée qui associerait entre elles les notions algébriques 
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et métriques. Pour introduire une métrique dans un espace vectoriel, 
il faut donc imposer à ce dernier des conditions supplémentaires. 

En fait, nous avons déjà traité des espaces vectoriels métriques. 
Ce sont, par exemple, l’espace euclidien et l’espace unitaire munis 
de métrique (29.4). Toutefois, une telle métrique est loin d'être 
toujours nécessaire. En introduisant un produit scalaire on intro- 
duit au fond non seulement une distance entre les éléments, mais 
encore des angles entre ces derniers. Mais le plus souvent, un espace 
vectoriel étant donné, on n’a besoin de connaître que la distance 
convenable. Les espaces vectoriels de cette sorte les plus importants 
sont ce qu'on appelle espaces normés. 

Un espace vectoriel X réel ou complexe est dit normé si à chaque 
vecteur x € X on fait correspondre un nombre réel ||xz|| appelé 
norme du vecteur x, tout en respectant les axiomes suivants: 


1. Izi1>0, sixz-Æ0, [[0||—0, 
2. IAz|I= |A] 1x, 
B3. Iz+ylI<lizi+|yi 


quels que soient les vecteurs x, y et le nombre À. Le deuxième axiome 
traduit l’homogénéité absolue de la norme, le troisième est l'inégalité 
triangulaire. 

L'homogénéité absolue de la norme entraîne que pour tout vecteur 

non nul z il existe un nombre À tel que la norme du vecteur Àz soit 
égale à l'unité. En effet, il suffit de choisir À —||z||"!. Un vecteur 
dont la norme est l’unité est dit normé. 
_ L'’inégalité triangulaire conduit à une relation utile. On a [[z|| < 
< ||y [1 + [x — y [quels que soient z, y. Par conséquent, || z || — 
— y [|<Iz—ylI. En permutant zx, y, on trouve {||y || — 
— [zx < zx — y. C'est pourquoi 


[zi—Hy I I<Uz- y: (52.1) 
Un espace normé se transforme facilement en un espace métrique 

si l’on pose 
p(z, y)=1lz—y||. (52.2) 


En effet, p (x, y) = 0 veut dire que |{|z —y|| = 0, ce qui d’après 
l’axiome 1 signifie que z = y. La symétrie de la distance intro- 
duite est évidente. Enfin, l'inégalité triangulaire de la distance est 
un simple corollaire de l'inégalité triangulaire de la norme. Plus 
précisément, 


pP(z y)=z-yl=l(-2)+(—-yli< 


<|Iz—2z+1z-yll=e(z, z)+e(, y). 
Constatons que 
Izll=p(z, 0). (52.3) 
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La métrique (52.2) définie dans un espace vectoriel jouit encore 
des propriétés suivantes : 


p(z +2, y +2) —=p (x, y) 


pour z, y, z € À quelconques, c'est-à-dire que la distance ne change 
pas avec la translation des vecteurs et 


p (Az, ÀAy) = |A | p (x, y) 


quels que soient les vecteurs x, y € X et le nombre À, c’est-à-dire 
la distance est une fonction absolument homogène. 

Si dans un espace vectoriel métrique X, la métrique satisfait 
à ces deux conditions supplémentaires, À peut être considéré comme 
un espace normé si l’on définit la norme par l'égalité (52.3) pour 
tout x E À. 

En tenant compte des relations du $ 29, on établit sans peine 
qu’un espace vectoriel muni de produit scalaire est un espace normé. 
Dans ces conditions il faut considérer comme norme d’un vecteur 
sa longueur. 

On peut donner d’autres exemples de l'introduction d'une norme. 
Supposons que les vecteurs d’un espace vectoriel soient donnés par 
leurs coordonnées dans une certaine base. Si 


T = (Zi Los - - 2), 
posons 


nr 1/ 
Izlb=(Z al)”, (52.4) 


où p > 1. Les deux premiers axiomes de la norme sont observés 
d’une façon évidente, le troisième étant justifié par l'inégalité 
de Minkowski (51.6). Les normes les plus utilisées sont 


ñn 
I x li = > | za |, 
R=—1 


Ce 1/2 | 
Izle=(Z 127) En) 


Izlle= max [za l. 
La deuxième de ces normes est dite euclidienne et se note ||z {l&. 
Dans ce qui suit nous ne considérons que les espaces normés 
avec (52.2) pour métrique. Dans cette métrique la convergence d’une 
suite des vecteurs s'appelle convergence en norme; tout ensemble 
borné des vecteurs est dit borné en norme, etc. 
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Exercices 
1. Montrer qu'il existe une suite des vecteurs dont les normes forment 


une suite infiniment grande. 
2. Montrer que pour tout nombre à, et pour tout vecteur e;, on a 


LL 


n 
IL D, Aell< D Ait lesll. 
{=1 


i=1 
3. Montrer que si zh —+ x, Yan» Y, Àn —+ à, il vient 


Il Zn [| — || z il, Zn+Yn+Tz+y Àntn + Àz. 


$ 53. Convergence en norme et convergence 
par coordonnées 


Dans un espace vectoriel de dimension finie réel ou complexe, 
outre la convergence en norme on peut définir encore une autre 
notion de la convergence. Examinons l’espace X et soit e,, e:, . .. 


«+» En Sa base. Pour toute suite {x,} de vecteurs de ZX il existe des 
développements 


LL — à pe (53.1) 
Si pour un vecteur : 

Lo = : EP’ez (53.2) 
les relations limites Il 

lim ER" — El? (53.3) 
ont lieu pour tout k# = 1, 2, ..., n, nous dirons que la suite {x} 


converge par coordonnées vers le vecteur zx. 

La convergence par coordonnées est parfaitement naturelle. 
Si deux vecteurs sont « proches », on peut supposer que leurs coor- 
données correspondantes suivant une même base doivent être « pro- 
ches » également. Les espaces normés de dimension finie sont remar- 
quables par le fait que la convergence en norme et la convergence 
par coordonnées y sont équivalentes. 

On montre aisément que la convergence par coordonnées entraîne 
la convergence en norme. En effet, soient des relations limites (53.3). 
En utilisant l’homogénéité absolue de la norme et l'inégalité triangu- 
laire, nous tirons de (53.1), (53.2): 


n 


ÎTm— 2 = 2 (EE —E)e ll < 2 [ET — EP] Il ex |] — 0. 


R= 
La démonstration de la réciproque est bien plus délicate. 
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Lemme 953.1. Si dans un espace normé de dimension finie une 
suite des vecteurs est bornée en norme, les suites numériques de toutes les 
coordonnées de ces vecteurs suivant une base quelconque sont égale- 
ment bornées. 

Démonstration. Supposons que chaque vecteur de la 
suite {z,} soit mis sous la forme (53.1). Désignons 


n 
Om= 2j |” | 
R=1 
et montrons que la suite {o,} est bornée. 


Supposons qu'il n’en est pas ainsi. Alors, on peut en extraire 
une sous-suite infiniment grande {Om }- Posons 


Si 


ñn 
Up = > ner, 
k=1 
alors, bien sür, 
= 
Omp 


pour tout À = 1, 2, ..., n et tout m,, et on obtient que 
ñn 
à inf |= 1. (53.4) 


ET Les suites {nf} sont bornées, puisque d’après (53.4) {n8} < 1. 
Par conséquent, on peut choisir une sous-suite des vecteurs {y,:} 
telle que la sous-suite {nf} soit convergente, c’est-à-dire 


lim nf =1% 

vi-co 
pour un certain nombre n,. De la sous-suite {y,,} on peut à son tour 
extraire une sous-suite {y,} telle que 

lim n°? = M 


Pz-— 00 
pour un certain nombre n.. De plus, comme auparavant, 
lim 12 = Ni: 
P2-+ 00 
En poursuivant le procédé, nous extrayons de la suite {y,} une 
sous-suite {y» } telle qu'il existe des limites 
lim nn) =, (53.5) 


Pro 


12—01090 
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quels que soient # = 1, 2, ..., n. D’après (53.4) 
D lml= 1. (53.6) 
k=1 


La convergence par coordonnées entraîne la convergence en norme, 
c’est pourquoi les relations limites (53.5) signifient que 


ue Yon —Y 1 = 0, (93.7) 


n 
y = D NRER. 
h=1 


Le vecteur y ne doit pas être nul en vertu de (53.6). D'autre part, 
on a 


Il Imph Il 


vpn = + 0, 


Mmph 


du fait que la sous-suite Um, } est bornée en norme, et la suite 
n 
{Om. } est infiniment grande. Par conséquent, (54.7) implique 


n 

IL y 11 = 0, c’est-à-dire que y est un vecteur nul. Cette contradiction 
prouve le lemme. 

Théorème 953.1. Dans un espace normé de dimension finie 
la convergence en norme entraine la convergence par coordonnées. 

Démonstration. Soit {r,} une suite des vecteurs qui 
converge en norme vers un vecteur z,. Il est évident qu'il suffit 
d'examiner le cas où z, = 0 et où la suite {r,,} ne possède pas de 
vecteurs nuls. Mettons les vecteurs x, sous la forme des développe- 
ments (53.1). La suite des vecteurs 


=——— Zz 
ne Tele 
sera bornée en norme et, d’après le lemme (53.1), les suites des 


nombres 
mn) 
ni = ëf 
Il Im Il 


doivent être bornées pour tout # = 1, 2, ..., nr. Etant donné 
que ||zh | — 0, ceci n’est possible que si E%? — 0 pour tout k. 
Or, cela signifie précisément que la convergence par coordonnées 
de la suite {1,} vers le vecteur zx, a lieu. 

La convergence par coordonnées est efficace pour des recherches 
théoriques, alors que dans les applications pratiques il est plus commo- 
de d'utiliser la convergence en norme. Il en est ainsi surtout parce 
que dans l'étude des espaces vectoriels de grande dimension, il est 
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difficile de manipuler avec un grand nombre de suites de coordonnées. 
De plus, on n'a pas toujours à sa disposition ne serait-ce qu'une base. 
Mais même si une base est connue, son utilisation conduit le plus 
souvent à des calculs très longs injustifiés. 


Exercices 


4. Pour prouver l’équivalence de deux formes de convergence est-il essen- 
tiel que l'espace soit de dimension finie? 

2. Montrer que si un ensemble des vecteurs d’un espace de dimension 
finie est borné en une norme, il le sera également en toute autre norme. 

3. Prouver que si dans un espace de dimension finie x, — x en une norme, 
il en est de même en toute autre norme. 


$ 54. Espaces normés complets 


Les espaces normés de dimension finie sont des espaces qui don- 
nent lieu à de nombreux analogues des propositions associées à la 
notion de limite et propres à des ensembles numériques. Considérons 
certaines de ces analogies. 

Lemme 54.1. De toute suite bornée des vecteurs d'un espace 
normé de dimension finie, on peut extraire une sous-suite convergente 
dans cet espace. 

Démonstration. Soit {r.,} une suite bornée en norme. 
Représentons les vecteurs x,, sous la forme de développements (53.1). 
D'après le lemme 53.1, les suites {Ef”} seront bornées pour tout 
k —1,2,...,n. De la même façon que pour la démonstration 
du lemme 53.1, extrayons de la suite {x,} la sous-suite (x, } qui 


donne lieu aux relations limites E£"") —. E(0) pour tout k. Il s'ensuit 
que la sous-suite {x,, } converge en norme vers le vecteur (53.2). 


Le lemme démontré est un analogue du lemme connu de Bolzano- 
Weierstrass de l’analyse mathématique. Il est très important pour 
l'étude des espaces normés de dimension finie. Nous illustrerons 
ce fait en démontrant certaines propositions. 

Théorème 54.1. Tout espace normé de dimension finie est 
complet. 


Démonstration. Soit {r,} une suite de Cauchy. C'est 
une suite bornée. Extrayons-en une suite convergente {r, } et 


notons sa limite x,. On a 
Î Tm — Lo A Lm — Zmn | Znn — Lo ||. 


Soit e > O0 un nombre arbitraire. Puisque la suite {x,, } est de 
Cauchy, il existe un W, tel que [| zm — zm, | e/2 pour m, m, > 
> N. La suite {z,, } étant convergente vers x,, il existe un NW; tel 


12? 
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que || Zm, — Zo [| < e/2 pour m, > N,. Si N est le plus grand des 
nombres WV,, N:, il vient pour m>N 


ÎTm — Lo | << €. 


Le nombre e est arbitraire. Par conséquent, la suite de Cauchy {x,,} 
converge en norme vers le vecteur xs. 

Lemme 54.2. Tout sous-espace de dimension finie X, d'un 
espace normé X est un ensemble fermé. 

Démonstration. Considérons dans un espace normé À 
un sous-espace de dimension finie X,. Supposons que le vecteur 
x € X soit un point limite de À,. Cela signifie qu'il existe une sous- 
suite {x,} des vecteurs de À, qui ne coïncident pas avec x, telle 
que |[zm — x || — 0. La suite {x,} est bornée; par conséquent, 
vu que À, est complet, on peut en extraire une sous-suite Tm, qui 


converge vers un vecteur x, € À. Maintenant on a 
az zo KIT mp Î + | Tmp — To || 0 


c'est-à-dire z = Zo. 

Lemme 54.3. Soient À un espace normé et X, son sous-espace 
de dimension finie distinct de X. Il existe un vecteur normé x & X, tel 
que [x — zo || > 1 pour tout vecteur xo E À 0. 

Démonstration. Le sous-espace X, ne coïncide pas 
avec X, il existe donc un vecteur z'6 X,. Puisque X, est fermé, 
il vient 

inf ||z'—xll=d>0. (54.1) 
xoEXo 


D'après la définition de la borne inférieure exacte, il existe dans X, 
un vecteur z* tel que 


dr IS 


La suite {x} est bornée. Tirons de cette suite une sous-suite z{) 
convergente ‘du fait que X, est complet vers un vecteur x € X0. 
Il est évident que pour ce vecteur 


Iz— 2 ||= d. (54.2) 
Posons 
4 , P 
z=—(r —x). 
Il est clair que ||xz || = 1. De plus, si x, € X,, d'après (54.1), on a 


Iz—zl=| 5-52 —2%| = 512 —(x +42) || > +d=1, 


puisque le vecteur zo + dx, appartient à X.. 
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Ainsi nous avons démontré en même temps que la borne inférieure 
de (54.1) est atteinte au moins sur un vecteur 4, € X,. Dans la 
relation || x — xzo || > 1, l'égalité a bien lieu pour x, = (. 

A titre de conclusion constatons que le lemme (54.1) qui joue 
un rôle si grand dans les espaces de dimension finie, n’a lieu 
dans aucun des espaces de dimension infinie. On vérifie, notam- 
ment, le 

Lemme 54.4. Si de toute suite bornée des vecteurs d’un espace 
normé X on peut extraire une sous-suile convergente, l'espace X est 
de dimension finie. 

Démonstration. Raisonnons par l'absurde. Soit À un 
espace de dimension infinie. Choisissons un vecteur normé quel- 
conque z, et notons L, son enveloppe linéaire. D'après le lemme 54.3, 
il existe un vecteur normé zx, tel que ||x, — x, || 1. Désignons 
par L, l'enveloppe linéaire des vecteurs zx,, z.. En poursuivant nos 
raisonnements, cherchons la suite {x,} des vecteurs normés qui véri- 
fient les inégalités ||z, — zx || > 1 pour tout k << n. Par consé- 
quent, il est impossible de choisir dans cette suite aucune sous- 
suite convergente. Ceci est en contradiction avec la condition du 
lemme, et la supposition sur la dimension infinie de l’espace X est 
donc incorrecte. 


Exercices 


1. Montrer qu'un plan dans un espace normé de dimension finie est un 
ensemble fermé. 

2. Montrer que tout ensemble des vecteurs z d’un espace de dimension 
finie qui vérifient la condition ||z | & & est un ensemble ferme. 

3. Montrer que dans un ensemble borné fermé des vecteurs d'un espace de 
dimension finie la borne inférieure aussi bien que la borne supérieure des valeurs 
d'une norme quelconque se réalisent sur certains vecteurs. 

4. Prouver que pour deux normes | z || et || x Ilr quelles qu'elles soient, 


ilexiste dans un espace de dimension finie des nombres positifs a, B tels que 
allzlir <lizllx BI zlx 


pour tout vecteur z. Les nombres a, B ne dépendent pas de x. 


$S 95. Limite et calcul numérique 


Dans un espace métrique complet la notion de la limite est d’un 
usage très général pour construire et justifier des méthodes de calcul 
numérique les plus différentes. Examinons à titre d'exemple l’une 
des méthodes de résolution des systèmes d’équations linéaires 
algébriques. 
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Soit un système de deux équations à deux inconnuts. Admettons 
qu'il soit compatible et qu'il possède une solution unique. Pour 
simplifier l’exposé, supposons que tous les coefficients soient réels. 
Chacune des équations 


QyyT + ait = 1, | 
GT + G2ot = f2 


du système définit une droite sur le plan. Le point À de l'intersection 
de ces droites correspond à la solution du système (fig. 99.1). 
Choisissons un point quelconque M, qui n'appartient à aucune 
de ces droites du plan. Abaïissons de ce point la perpendiculaire sur 
l’une des droites. Le pied M, de 
4 la perpendiculaire sera plus pro- 
che du point M que le point 
M) du fait qu'une projection 
est toujours plus petite qu'une 
oblique. Abaissons ensuite la 
perpendiculaire du point M, sur 
l’autre droite. Le pied M, de 
cette perpendiculaire s’approche- 
ra encore plus de la solution. 
En réalisant ainsi les projections 
tantôt sur l’une tantôt sur l’au- 
tre droite, nous obtenons la suite 
Fig. 55.1. {M,} des points du plan con- 
vergente vers Île point M. Il 
importe de noter que la convergence de la suite ainsi construite 
a lieu quel que soit le choix du point initial M,. 

Cet exemple suggère comment on peut construire un processus 
de calcul numérique pour résoudre un système d'équations linéaires 
algébriques de la forme générale (48.2). Remplaçons le problème 
donné par le problème équivalent de la recherche des vecteurs de 
l'intersection des hyperplans (46.9). Supposons que les hyperplans 
possèdent au moins un vecteur commun et admettons par souci de 
simplification que l’espace vectoriel soit réel. 

Choisissons un vecteur arbitraire v, et projetons-le sur le premier 
hyperplan. Le vecteur obtenu v, est projeté ensuite sur le deuxième 
hyperplan, etc. Ce processus définit une certaine suite {v,} que nous 
allons soumettre à l’étude. 

Le point essentiel du processus de calcul est la projection d'un 
vecteur v, sur l’hyperplan donné par l'équation (46.8). Il est clair 
que le vecteur v,+, vérifie cette équation et qu'il est associé au vec- 
teur v, par l'égalité 


Up+1 =Up+in 
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avec un certain nombre {. Calculons £ en portant v,;, dans l'équation 
(46.8). On en tire que 


b—(n, Up) 
m9 


Cette formule entraine que tous les vecteurs de la suite {v,} 
appartiennent au plan obtenu par translation de l'enveloppe linéaire 
L (f19 Pay + + +, x) Suivant le vecteur v,. Or, tous les vecteurs qui 
appartiennent à l'intersection des hyperplans (46.9) appartiennent 
également au plan obtenu par translation du complément orthogonal 
LA (n1, n3, . - ., nx). Il existe un seul vecteur z, qui appartient 
aux deux plans. 

Si nous prouvons qu’une sous-suite extraite de {v,} converge 
vers un vecteur appartenant aux hyperplans (46.9), alors, le plan 
étant fermé, elle convergera precisément vers z,. De plus, toute la 
suite {v } convergera également vers le vecteur 2. 

Pour tout r, les vecteurs Zz9 — U,+1, Vr+1 — v, sont orthogonaux; 
il en résulte, d'après le théorème de Pythagore, 


pi = Vp+ ( 


PŸ (20; Ur) = P° (20; Ur+1) + P° (Ur, Vrés). 


En sommant les égalités obtenues par rapport à r de O0 à p — 1, 
on trouve 


p-i 


p° (20 Lo) _— p° (20, Up) + > p° (u,. Ur+1). 
r=0 


Par conséquent, 


p-!i 
à p° (Cr, Ur44) LP” (Zo» Vo); 
d'où 
D (Up; Up+s) —+ 0. (55.1) 


Notons H, l'hyperplan de la r-ième ligne de (46.9). Il est clair 
que la distance entre le vecteur v, et H, n’est pas plus grande qu'entre 
vr et tout vecteur de H,. D'après la construction de {v,}, parmi 
n'importe quels À vecteurs successifs de cette suite, il existe néces- 
sairement un vecteur appartenant à l’un quelconque des hyperplans. 
En utilisant l'inégalité triangulaire et la relation limite (55.1), 
on obtient 


P (Up; H})<P (U>; Up+1) + P (Up+1: Up+2) a es 
se + P (Up+h-13 Vp+r) — 0 (55.2) 
pour tout r = 1, 2, ...,k. 
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La suite {v,} est évidemment bornée. Extrayons-en une sous-suite 
convergente quelconque. Supposons qu'elle converge vers un vec- 
teur z. En passant à la limite dans (55.2), on trouve que 


P (Z Hr) = 0 


pour tout r — 1, 2, ..., k. Mais comme nous l'avons déjà dit, 
le vecteur & coïncide avec z,. Par conséquent, la suite {v,} converge 
Vers Zo- 


Exercices 


1. Les notions d’espace complet et d'ensemble fermé ont-elles été utilisées 
essentiellement dans la discussion ci-dessus? 
2. Comment trouver d’autres solutions du système si elles existent? 
: : Quel sera le comportement du processus si le système est incompa- 
tible 


DEUXIÈME PARTIE 
OPÉRATEURS LINÉAIRES 


CHAPITRE 7 
MATRICES ET OPÉRATEURS LINÉAIRES 


$S 56. Opérateurs 


Dans l'élaboration des principes de l'analyse mathématique 
l'introduction de la notion de la fonction est un élément d'importance 
majeure. Par définition, pour donner une fonction il faut indiquer 
deux ensembles X, Ÿ des nombres réels et formuler une loi qui 
à tout nombre x € X fait correspondre un nombre unique y € Y. 
C'est cette loi précisément qui représente une fonction univoque 
d’une variable réelle x donnée sur l’ensemble X. 

Pour réaliser l’idée générale de la dépendance fonctionnelle il 
n’est nullement besoin d'imposer que X, Ÿ soient des ensembles 
des nombres réels. En entendant par X, Ÿ les ensembles des éléments 
de nature quelconque, on est amené à la définition suivante qui 
généralise la notion de la fonction. 

Une loi qui à chaque élément x d’un ensemble non vide X fait 
correspondre un élément unique y d’un ensemble non vide Ÿ s'appelle 
opérateur. Le résultat y de l'application de l'opérateur À à un élé- 
ment x est noté 


y=A(z), y = Ar (56.1) 


et on dit que l'opérateur À agit de X dans Y ou applique X dans Y. 

Un ensemble X s’appelle domaine de définition de l'opérateur À. 
L'élément y de (56.1) est appelé image (ou image directe) de l'éle- 
ment x, et x lui-même image réciproque de l'élément y. L'ensemble T, 
de toutes les images se nomme domaine des valeurs de l’opérateur À 
ou image de X par l’opérateur À. Dans le cas où chaque élément 
y E Ÿ possède une image réciproque et une seule, la loi (56.1) est 
dite bijective. Un opérateur est nommé aussi application, transforma- 
lion ou opération. 

Dans ce qui suit nous étudierons surtout les opérateurs dits linéai- 
res. Ils se distinguent par les particularités suivantes. Premièrement, 
le domaine de définition d’un opérateur linéaire est toujours un espa- 
ce ou un sous-espace vectoriel. Deuxièmement, les propriétés d’un 
opérateur linéaire sont intimement liées aux opérations sur les 
vecteurs d'un espace vectoriel. En règle générale, nous supposons en 
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étudiant les opérateurs linéaires que les espaces soient donnés sur 
le corps des nombres réels ou sur celui des nombres complexes. Sauf 
mention expresse du contraire, nous entendrons par opérateur un 
opérateur linéaire. Dans la théorie générale des opérateurs, les opéra- 
teurs linéaires jouent un rôle aussi important que la droite et le 
plan dans l’analyse mathématique traditionnelle. C’est ce qui définit 
au fond la nécessité de les étudier de près. 

Soient X, YŸ des espaces vectoriels sur un même corps P. Exami- 
nons un opérateur À ayant pour domaine de définition l’espace X, 
et pour domaine de valeur un ensemble de Ÿ. L'opérateur À est dit 
linéaire si 


A (au + Bv) = aAu + BAv (56.2) 


quels que soient les vecteurs u, v € X et les nombres a, B € P. 

Nous avons déjà traité à plus d’une reprise des opérateurs linéai- 
res. D'après (9.8) la mesure algébrique d’un segment orienté est un 
opérateur linéaire. Le domaine de sa définition est l’ensemble des 
segments orientés d’un axe, le’ domaine des valeurs coïncide avec 
l’ensemble des nombres réels. Comme il résulte de (21.2), une 
Correspondance isomorphe entre deux espaces vectoriels est un opéra- 
teur linéaire. Fixons dans un espace vectoriel muni d’un produit 
scalaire un sous-espace L. Nous obtiendrons deux opérateurs linéaires 
si à chaque vecteur de l’espace nous associons soit sa projection sur 
le sous-espace Z, soit la perpendiculaire abaïssée de ce vecteur sur L. 
Cette proposition est justifiée par (30.5), (30.6). 

L'opérateur qui à chaque vecteur z de l’espace X fait correspondre 
le vecteur nul de l’espace Y est évidemment un opérateur linéaire. 
Il s'appelle opérateur nul et se note 0. Ainsi 


0 = Oz. 


À chaque vecteur x € X associons ce même vecteur x. Nous obtien- 
drons un opérateur linéaire Æ de X dans X. Cet opérateur est dit 
identique ou opérateur unité. Par définition, 


z = Ex. 


Soit un opérateur linéaire À de l’espace X dans l’espace Y. Cons- 
truisons un nouvel opérateur B d’après la condition Bxz — —Azx. 
L'opérateur obtenu B est aussi un opérateur linéaire de X dans Ÿ. 
Il s'appelle opérateur opposé à l'opérateur À. 

Fixons, enfin, un nombre arbitraire & et à chaque vecteur x € X 
faisons correspondre le vecteur ax € X. L'opérateur ainsi construit 
sera, évidemment, un opérateur linéaire. Il s'appelle opérateur 
scalaire. Pour a — 0, on obtient l'opérateur nul et pour a = 1, 
l'opérateur identique. 

Nous allons indiquer une méthode générale de construction des 
opérateurs linéaires, mais pour le moment nous ne signalons que 


$ 56.] OPÉRATEURS 187 


certaines de leurs particularités caractéristiques. Il résulte de (56.2) 
que les vecteurs zx; et les nombres a; quels qu'ils soient donnent 
lieu à la relation 


P P 
A (2 CR) = à, &AÂT:;. 


On en tire, notamment, que tout opérateur linéaire À transforme 
un vecteur nul en un vecteur nul, c'est-à-dire 


0 = A0. 


Le domaine des valeurs T, d’un opérateur linéaire À est un sous- 
espace de l’espace Y. Si z = Au, w = Av, le vecteur az + Bw est 
l'image du vecteur au + fu quels que soient les nombres a, $. 
Par conséquent, le vecteur az + fw appartient au domaine des 
valeurs de l’opérateur À. La dimension du sous-espace T4 s'appelle 
rang de l'opérateur et se note r;. 

Tout en étudiant T,, examinons l’ensemble V, des vecteurs 
z E X qui vérifient l'égalité 


Az = (. 


Cet ensemble ést également un sous-espace et on l’appelle noyau 
de l'opérateur À. La dimension n, du noyau s'appelle défaut de 
l'opérateur À. 

Le rang et le défaut ne sont pas des caractéristiques indépendantes 
d’un opérateur linéaire À. Soit X un espace de dimension m. Décom- 
posons-le en une somme directe 


X=N,+M,, (56.3) 


où V, est le noyau de l'opérateur À, et M, tout sous-espace complé- 
mentaire. Fixons un vecteur quelconque zx € Ÿ et mettons-le sous 
la forme 


TZ = TN + TM 


où znNE Na, tm E MA. Si y = Az, la linéarité de l’opérateur À 
et la condition Azy = 0 entraînent 


U = At. 


Par conséquent, tout vecteur de T\ possède au moins une image 
réciproque dans M\. 

En fait, cette image réciproque dans M, est unique. Supposons 
qu'un vecteur quelconque y € T\ possède deux images réciproques 
ZM» TM E M. Etant donné que À, est un sous-espace, zy — zm € 
€ M,. Mais comme zy et zu sont des images réciproques d’un même 
vecteur y, zy — zy € N,. Les sous-espaces M, et NA n'ont de com- 
mun que le vecteur nul. C’est pourquoi zy — zx = 0, c’est-à-dire 
TM — LT: 
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Ainsi, un opérateur linéaire À établit une correspondance biunivo- 
que entre les vecteurs des sous-espaces T4 et M1. L'opérateur étant 
linéaire, cette correspondance est un isomorphisme. Par suite, les 
dimensions de T', et M, coïncident et sont égales à r4. A présent, 
la décomposition (56.3) entraîne que 


TA + la = M. (56.4) 


Notons qu’un opérateur linéaire À établit une correspondance 
isomorphe entre le sous-espace TT, et fout sous-espace M, de À qui 
en somme directe avec le noyau de l'opérateur donne l’espace À 
tout entier. On peut donc dire que chaque opérateur linéaire À 
engendre toute une famille d’autres opérateurs linéaires. Première- 
ment, c’est l'opérateur nul défini sur le noyau W,, c’est-à-dire agis- 
sant de V, dans 0. Deuxièmement, c'est l’ensemble des opérateurs 
linéaires agissant des sous-espaces M, complémentaires du noyau 
dans le sous-espace T'.,. Le fait très important est que chacun de ces 
nouveaux opérateurs coïncide sur son domaine de définition avec 
l'opérateur À. Si NV, = 0, alors M, = X et tout le deuxième en- 
semble des opérateurs se réduit à l'opérateur À. Mais si M1 = X, 
A est un opérateur nul. Nous allons encore revenir à ces questions. 


Exercices. Prouver que les opérateurs suivants sont des opérateurs linéaires. 


1. Une base est donnée dans un espace vectoriel X. L'opérateur À associe 
à tout vecteur x € X sa coordonnée d’un numéro fixe. 
. Un vecteur zo est fixé dans un espace X muni d'un produit scalaire. 
L'opérateur À associe à tout vecteur x € X le produit scalaire (x, xo). 

3. Un vecteur zo est fixé dans l’espace V,. L'opérateur À associe à tout 
vecteur zx € X le produit vectoriel [z, xol. | 

4. L'espace X se compose des er à coefficients réels. L'’opéra- 
teur À associe à tout polynôme sa dérivée k-ième. Cet opérateur s'appelle opé- 
rateur de dérivation k-ième. 

5. Dans l’espace des polynômes d'une variable +, l'opérateur À associe 
à tout polynôme P (t) le polynôme t-P (t). 

6. Un espace X est décomposé en somme directe de deux sous-espaces S 
et 7. Mettons chaque vecteur x € X sous la forme d’une somme x = u + v, 
oùuES,vE T. L'opérateur À associe au vecteur z le vecteur u. Cet opérateur 
s'appelle opérateur de projection sur le sous-espace S parallèlement au sous- 
espace T | 


$ 57. Espace vectoriel des opérateurs 


Fixons deux espaces vectoriels X et Ÿ sur un même corps P et 
considérons l’ensemble w,-7 de tous les opérateurs linéaires de X 
dans Ÿ. On peut introduire dans l’ensemble w,# les opérations d’ad- 
dition des opérateurs et de la multiplication d’un opérateur par un 
nombre de P, en transformant par là w;#7 en un espace vectoriel. 
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Deux opérateurs 4, B de X dans Y sont dits égaux s'ils satisfont 
à l'égalité 
Az = Bz 


pour tout vecteur z € X. On vérifie aisément que la relation d'égalité 
des opérateurs est une relation d'équivalence. L'égalité des opéra- 
teurs est notée 


A = B. 


Un opérateur C s'appelle somme de deux opérateurs À, B agissant 
de X dans Ÿ si 


Cx = Az + Bz 
pour tout vecteur x € X. La somme des opérateurs est notée 
C = A +B. 


Par définition, on peut additionner n'importe quels opérateurs 
de X dans Ÿ. Si À et B sont des opérateurs linéaires de wxy, leur 
somme sera également un opérateur linéaire de wxy. Quels que 
soient deux vecteurs uw, v € X et des nombres a, BE P,ona 


C (au + Bu) = À (au + Bu) + B (au + BPv) — 

aAu + PAv + aBu + BBv — 

a (Au + Bu) + 8 (Av + Bv) = aCu + Cv. 
L’addition des opérateurs est une opération algébrique. De plus, 


elle est associative. En effet, soient À, B, C trois opérateurs linéaires 
de wxy. Alors, pour tout vecteur x € X, on a les relations 


(4 + B)+C)z=(A4 + B)z+Cz = Az + Bx + Cr = 
= Az +(Brz +Cr) = Az +(B+C)rz =(A +(B +C))x. 
Cela signifie que 
(4+B)+C=A+(B+C). 


L'addition des opérateurs est commutative. Si À, B sont des 
opérateurs quelconques de w+>7, z un vecteur quelconque de X, alors 


(A + B) x = Az + Bxz = Bxz + Az = (B + À)zx, 


c'est-à-dire 


A+B—=B+A. 


Maintenant on montre aisément que l’ensemble w+- est un groupe 
abélien par rapport à l'addition des opérateurs. Cet ensemble possède 
au moins un élément nul, par exemple l'opérateur nul. Chaque élé- 
ment de w>ÿ possède au moins un élément opposé, par exemple 
l'opérateur opposé. Le reste découle du théorème 7.1. 
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Ce même théorème entraîne que l'addition des opérateurs possède 
une opération inverse. Nous l’appellerons soustraction et employerons 
sa notation et ses propriétés usuelles. 

Un opérateur C est le produit de l’opérateur À de X dans Y 
par le nombre À du corps P si 


Cz = }-Az 
pour tout vecteur x € X. Ce produit est noté 
C —_— AA. 


Le produit d’un opérateur linéaire de wx#ÿ par un nombre est 
encore un opérateur linéaire de w-r-. En effet, quels que soient les 
vecteurs u, v € X et les nombres a, BE P,0on a 


C (au + Bu) = ÀA (au + Bu) = À (aAu + BAv) — 
= a (Adu) + B (AAv) = aCu + BCv. 


On voit sans peine que l'addition des opérateurs et la multipli- 
cation d’un opérateur par un nombre possèdent toutes les propriétés 
qui définissent un espace vectoriel. Par conséquent, l’ensemble woxy 
des opérateurs linéaires de XÀ dans Ÿ est un nouvel espace vectoriel. 
I] s'ensuit que par rapport à la multiplication d’un opérateur par 
un nombre, à l’addition et à la soustraction des opérateurs, sont 
._ valables toutes les règles ordinaires des transformations équivalentes 
des expressions algébriques. Dans ce qui suit nous ne mentionnerons 
plus ces règles de façon tacite. 

Constatons que nous n'avons recouru nulle part à une relation 
quelconque entre les espaces vectoriels X, Ÿ eux-mêmes. Ces espaces 
peuvent être distincts ou confondus. L'ensemble w,+ des opérateurs 
linéaires de À dans X sera l’un des objets essentiels de notre discus- 
sion. Ces opérateurs seront appelés opérateurs linéaires dans X. 


Exercices 


4. Montrer que la multiplication d’un opérateur par un nombre non nul 
ne change pas son rang ni son défaut. 

2. Montrer que le rang de la somme des opérateurs ne dépasse pas la somme 
des rangs des termes. 

3. Montrer qu’un ensemble des opérateurs linéaires de w;.- dont les domai- 
nes des valeurs appartiennent au même sous-espace, représente lui-même un 
sous-espace vectoriel. 

4. Montrer qu'un système de deux opérateurs non nuls de w,- dont les 
domaines des valeurs sont distincts, est linéairement indépendant. 

5. Montrer que l’espace des opérateurs linéaires dans V, est à une dimen- 
sion. 
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$ 58. Anneau des opérateurs 


Considérons trois espaces vectoriels X, Ÿ, Z sur un corps P. 
Soient À un opérateur de X dans Ÿ, B un opérateur de Y dans Z. 

On dit que l’opérateur C de X dans Z est le produit de l'opérateur 
B par l'opérateur À si 


Cx = B (Az) 
pour tout vecteur x € X. Le produit des opérateurs B et À est noté 
C = BA. 


Le produit de deux opérateurs linéaires est encore un opérateur 
linéaire. Pour des vecteurs u, v € X et des nombres a, B € P quels 
qu'ils soient, 


C'(au + Bu) = B (4 (au + Bv)) = B (aAu + BAv) — 
= aB (Au) + BB (Av) = aCu + Cv. 


La multiplication des opérateurs n’est pas une opération algébri- 
que parce que le produit n’est pas défini pour tout couple d'opéra- 
teurs. Néanmoins, lorsque la multiplication est exécutable, elle 
jouit des propriétés parfaitement naturelles : 


1. (AB)C= À (BC), 

2. À(BA)=(À1B) A=B(ÀA), 
3 (4+B)C= AC + BC, 

4. A(B+0C)=AB+ AC 


quels que soient les opérateurs À, B, C et le nombre À de P, si, 
certes, les expressions en question sont définies. 

Toutes ces propriétés sont démontrées de la même façon; nous 
allons donc nous borner à la première propriété. Soient X, Y, Z, U 
des espaces vectoriels fixes, À, B, C des opérateurs linéaires quel- 
conques où À agit de X dans Ÿ, B de Ÿ dans Z, C de Z dans U. 
Constatons tout d’abord que les deux opérateurs (4B) C et À (BC) 
de l'égalité 1 sont définis. Pour tout vecteur xE X,on a 


((4B) ©) x = AB (Czx) = À (B (Cx)), 
(A (BC)) x = À (BCzx) = À (B (Cx)), 
d'où l’égalité 1. 

Examinons encore une fois l’ensemble w,, des opérateurs linéaires 
dans X. La somme et le produit sont définis pour deux opérateurs 
quelconques de wxx. D'après les propriétés 3, 4, les deux opérations 
sont associées par la loi distributive. C’est pourquoi l’ensemble des 


opérateurs linéaires w+x est un anneau. Comme nous le montrerons 
plus loin, l’anneau des opérateurs est non commutatif. I] peut se 


(58.1) 
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— 


trouver bien sûr que, par hasard, un couple concret d'opérateurs 4, 
B vérifie la relation AB = BA. Pour de tels opérateurs nous allons 
dire qu’ils commutent. En particulier, un opérateur identique com- 
mute avec n'importe quel opérateur. 

Dans l’anneau des opérateurs linéaires, de même que dans n’im- 
porte quel autre anneau, le produit de tout opérateur par l’opérateur 
nul est encore l'opérateur nul. La loi distributive associe à la multi- 
plication non seulement l’addition des opérateurs, mais aussi leur 
soustraction. L’anneau des opérateurs linéaires est en même temps un 
espace vectoriel; c'est pourquoi la différence des opérateurs vérifie 
la formule 


A—B=—A+(—1)8. 


La propriété 2 de (58.1) traduit la relation entre la multiplication 
des opérateurs dans un anneau et la multiplication par un nombre. 
Toutes les relations qui se déduisent des propriétés des espaces 
vectoriels restent évidemment en vigueur. 


Exercices 


1. Dans un espace des polynômes d'une variable t notons D l'opérateur 
de dérivation, 7 l'opérateur de multiplication par t. Montrer que DT # TD. 
Trouver l'opérateur DT — TD. 

. Fixons un opérateur B de l’espace w,X7. Montrer que l'ensemble des 
opérateurs À tels que BA = 0 est un sous-espace dans wyx. 

3. Montrer Es le rang d’un produit d'opérateurs n’est pas supérieur au 
rang de chacun des facteurs. 

4. Montrer que le défaut d’un produit d'opérateurs n'est pas inférieur au 


défaut de chacun des facteurs. 
5. Montrer que l'anneau w,-+ des opérateurs linéaires possède des diviseurs 


de Zéro. 


$S 59. Groupe des opérateurs non dégénérés 


Les opérateurs linéaires dans X forment un groupe abélien par 
rapport à l'addition. Mais parmi ces opérateurs on peut indiquer des 
ensembles qui sont des groupes multiplicatifs. Ces groupes sont asso- 
ciés à ce qu’on appelle les opérateurs non dégénérés. 

Un opérateur dans un espace vectoriel est dit non dégénéré si 
son noyau n’est composé que de vecteur nul. Un opérateur qui n’est 
pas non dégénéré est dit dégénéré. 

Parmi les opérateurs non dégénérés il y a par exemple, l’opéra- 
teur identique et l’opérateur scalaire, si seulement ce dernier n'est 
pas nul. Parfois, même lorsqu'un opérateur À dans X est dégénéré, 
on peut lui associer un opérateur non dégénéré. En effet, soient T, 
le domaine des valeurs de l'opérateur À et V4 son noyau. Si T; 
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et NV, ne possèdent pas de vecteurs non nuls communs, alors, d’après 
(56.4), on a 


KX=N 27: 


Comme nous l’avons déjà dit, l'opérateur À engendre un ensemble 
d’autres opérateurs agissant d'un sous-espace quelconque complé- 
mentaire du noyau W, dans le sous-espace des valeurs 7 ,. Dans notre 
cas, l’opérateur À engendre un opérateur de 7, dans T',. Cet opéra- 
teur sera non dégénéré du fait qu’il n’annule que le vecteur nul de 7 .. 

Les opérateurs non dégénérés possèdent de nombreuses propriétés 
remarquables. Leur défaut est nul, donc la formule (56.4) entraîne 
que le rang d’un opérateur non dégénéré coïncide avec la dimension 
de l’espace. Si un opérateur À non dégénéré agit dans X, le domaine 
des valeurs T'A coïncide avec À. Ainsi, tout vecteur de X est l’image 
d'un vecteur de X. Cette propriété d’un opérateur non dégénéré est 
équivalente à sa définition. 

Une propriété importante de l’opérateur non dégénéré est l'uni- 
cité de son image réciproque pour tout vecteur de l’espace. En effet, 


supposons que pour un vecteur y il existe deux images réciproques «, 
v. Cela signifie que 


Alors 
A (u — v) = 0. 


D'après la définition d'un opérateur non dégénéré, le noyau se com- 
pose du seul vecteur nul. C’est pourquoi u — v = 0, ou u = vw. 
La propriété démontrée est également équivalente à la définition d’un 
opérateur non dégénéré. Au fond, elle a été déjà examinée au $ 56. 

Un produit de tout nombre fini d’opérateurs non dégénérés est 
encore un opérateur non dégénéré. Il est évident qu’il suffit de dé- 
montrer cette proposition pour deux opérateurs. Soient À, B deux 


opérateurs non dégénérés quelconques d’un même espace X. Considé- 
rons l'équation 


BAz = 0. (59.1) 


D'après la définition de la multiplication des opérateurs, cette 
équation signifie que 


B (Az) = 0. 


L'opérateur B est non dégénéré ; la dernière équation entraîne donc 
que Az = 0. Mais À est lui aussi un opérateur non dégénéré ; il en 
résulte que zx = 0. Ainsi, l’équation (59.1) se vérifie seulement par 
le vecteur nul, c’est-à-dire l'opérateur BA est non dégénéré. 

La somme des opérateurs non dégénérés ne sera plus nécessaire- 
ment un opérateur non dégénéré. Si À est un opérateur non dégénéré, 
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l'opérateur (—1) À le sera également, mais la somme de ces opéra- 
teurs est un opérateur nul qui est dégénéré. 

Examinons l’ensemble des opérateurs non dégénérés dans un 
espace vectoriel. Sur cet ensemble, la multiplication des opérateurs 
est une opération algébrique et de plus associative. Parmi les opéra- 
teurs non dégénérés il y a aussi l'opérateur identique Æ qui joue le 
rôle de l'unité. En effet, on vérifie facilement que pour tout opéra- 
teur À de X 


AE = EA = À. 


Si nous montrons que pour tout opérateur non dégénéré À il existe 
un opérateur non dégénéré dont le produit par À est l'opérateur 
identique, cela signifie que l’ensemble des opérateurs non dégénérés 
est un groupe multiplicatif. 

Soit À un opérateur non dégénéré. Comme nous le savons, pour 
tout vecteur y € X il existe un vecteur x € À et un seul associé 
à y par la relation 


y = Az. (59.2) 


Par conséquent, à tout vecteur y € À on peut faire correspondre un 
seul vecteur x € X tel que y soit son image. La correspondance ainsi 
construite est un opérateur ; ce dernier est appelée opérateur inverse 
à l'opérateur À et noté À "1. Si l'égalité (59.2) a lieu, il vient 


xz= A”y. (59.3) 


Prouvons qu’un opérateur inverse est linéaire et non dégénéré. 

Le produit est défini pour n’importe quels opérateurs et non seule- 
ment pour des opérateurs linéaires. 11 s'ensuit de la définition de 
l'opérateur inverse que 


A71A = AA”i=E. (59.4) 


Pour démontrer ces égalités il suffit d'appliquer aux deux membres 
de (59.2) l'opérateur À}, et aux deux membres de (59.3) l’opéra- 
teur À. 

Choisissons n'importe quels vecteurs u, v € À et nombres «a, 
B € P et considérons le vecteur 


z = AT! (œu + Bu) —aA"u—$BA’iv, 
Appliquons maintenant aux deux membres de l'égalité l'opérateur À. 
En tenant compte de la linéarité de l'opérateur À et des relations 


(59.4), tirons que Az — 0. L'opérateur À étant non dégénéré, cela 
signifie que z = 0. Donc 


A"f (œu + Bu) = «Alu + BATiv, 


c'est-à-dire l'opérateur A”! est linéaire. 
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On montre sans peine que l’opérateur À -! est non dégénéré. Pour 
tout vecteur y du noyau de l'opérateur A-!, on a 


Aty=0. 


Appliquons aux deux membres de cette égalité l'opérateur À. 
Puisque À est un opérateur linéaire, AO = 0. En tenant compte des 
relations (59.4), on déduit que y = 0. Ainsi, le noyau de l'opérateur 
A”! n’est composé que de vecteur nul, c’est-à-dire À”! est un opé- 
rateur non dégénéré. 

De cette façon, l’ensemble des opérateurs non dégénérés est un 
groupe multiplicatif. Un peu plus loin nous montrerons que ce groupe 
est non commulatif. 

A l’aide des opérateurs non dégénérés on peut construire égale- 
ment des groupes commutatifs. Soit À un opérateur quelconque 
dans X. Pour tout entier positif p déterminons le p-ième degré de 
l'opérateur À par l'égalité 

D 


mn, 
A°=A.A ... À, (59.5) 


où le second membre contient p facteurs. La multiplication étant 
associative, la définition de l’opérateur AP est univoque. Il est évi- 
dent que cet opérateur est linéaire. 

Pour des entiers positifs quelconques p, r il s'ensuit de (59.5) que 


APA'"= AP*". (59.6) 
Si l’on pose par définition 
A =E 
pour tout opérateur À, la formule (59.6) a lieu pour des entiers non 
négatifs p, r quels qu'ils soient. 
Supposons que À soit un opérateur non dégénéré, alors pour tout r 


non négatif l’opérateur À” est également non dégénéré. Il existe donc 
son inverse. D’après les formules (7.2), (59.5), on a 


Tr 


(A) = (471) = A-1A" A, (59.7) 
Adoptons également par définition que 
A = (AE 


Si l’on tient compte des formules (59.5), (59.7) et du fait que AA”! — 
= A714, on montre facilement que 


APA7"— A"AP 
pour des entiers non négatifs quelconques p, r. Cela signifie que la 
formule (59.6) a lieu pour n'importe quels entiers p, r. 
13* 
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Fixons maintenant un opérateur non dégénéré À et composons 
l'ensemble w, des opérateurs de la forme A4? pour tous les entiers p. 
La multiplication des opérateurs de cet ensemble est une opération 
algébrique et, comme il résulte de (59.6), elle est commutative. Chaque 
opérateur À? possède son inverse À ?P. L'ensemble w. contient égale- 
ment l'opérateur identique Æ. Par conséquent, l’ensemble w, est 
un groupe commutatif par rapport à la multiplication. On dit que 
c'est le groupe cyclique engendré par l’opérateur À. 


Exercices 


1. Montrer que si pour deux opérateurs linéaires 4, B de w+->7 on vérifie 
la relation AB — E, les deux opérateurs sont non dégénérés. 

2. Montrer que pour que deux opérateurs À, B de w- soient non dégénérés, 
il faut et il suffit que les opérateurs AB et BA soient non dégénérés. 

3. Prouver que si un opérateur À est non dégénéré et un nombre a 0, 


l'opérateur aA est lui aussi non dégénéré et (aA)-1 — AT. 
4. Montrer que 7, € ÿV, si et seulement si A? = 0. 
5. Montrer que tout opérateur À vérifie les relations 
NAZNyENy3S ee.) 
TA =Tya2=Tas= ... 
6. Prouver qu'un opérateur P est un opérateur de projection si et seule- 
ment si P2?— P. Les sous-espaces N, et TK que représentent-ils? 
7. Montrer que si P est un opérateur de projection, £ — P l’est également. 
8. Montrer que si un opérateur À satisfait à l'égalité Am = 0 pour un m 


entier positif quelconque, 1 opérateur «E — À est un opérateur non dégénéré 
quel que soit le nombre a 0. 

9. Prouver qu'un opérateur linéaire À tel que E + «A + aA1 + ... 
‘... + anA' = Ù est non dégénéré. 

40. Montrer que si À est un opérateur non dégénéré, alors ou bien tous 
les opérateurs du groupe cyclique w, sont différents, ou bien un certain degré 
de l'opérateur À coïncide avec l'opérateur identique. 


$ 60. Matrice d'un opérateur 


Considérons une méthode générale de construction d'un opérateur 
linéaire d’uir, espace X de dimension m dans un espace Ÿ de dimen- 
sion nr. Supposons qu'aux vecteurs de base e,, e., . .., en de l’espace 
X on associe des vecteurs quelconques f,, f:, . . ., fm de l’espace Y. 
IL existe alors un opérateur linéaire À et un seul de X dans Y qui 


transforme chaque vecteur e, en le vecteur f:. 
Supposons que l'opérateur recherché existe. Mettons n'importe 


quel vecteur x € X sous la forme 


z = Eje, + bces + . . . + Enem. 
Alors, 


Az= À (> tes) — > Er Aex = D Enfn 
h=1 K=1 R=1 
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Les seconds membres de ces relations sont bien définis par le vecteur z 
et les images de la base. C’est pourquoi, si l'opérateur À existe, cette 
égalité traduit son unicité. D'autre part, nous pouvons définir 
l'opérateur À précisément par cette égalité, c’est-à-dire poser 


Az = à Exfh- 
R=1 


On voit aisément que l'opérateur obtenu est un opérateur linéaire 
de X dans Ÿ qui transforme tout vecteur e, en le vecteur f,. Le 
domaine des valeurs 7’, de l’opérateur À coïncide avec l’enveloppe 
linéaire du système de vecteurs f,, f2, . : ., fm- 

A présent on peut formuler une conclusion importante: tout 
opérateur linéaire À de X dans Y est complètement défini par la col- 
lection des images 

At, A6,, ..., Am 
d'une base quelconque 
Egs Cor - +3 Em 


de l'espace X. 
Fixons dans l’espace X une base e,, e., . .., e, et dans l’espace 
YŸ une base q, Qe, - - ., 4n- Le vecteur e, est transformé par l'opé- 


rateur À en un vecteur Àe, de l’espace Ÿ, qui, comme tout vecteur 
de cet espace, peut être développé suivant les vecteurs de base 


Ati = Giigi Foie + ce + AniQne 
D'une façon analogue, 
A3 = Gi9Q1 + A2oQ2 + + H An2Qns 


Am = AymQi + Goemg2 + +. + AnmIn: 


Les coefficients a;; de ces relations définissent la matrice 4,4 de nr 
lignes et m colonnes 


Ani An2 --- nm 


qui s'appelle matrice de l'opérateur À dans les bases choisies. 

Les colonnes d’une matrice de l’opérateur sont constituées par 
les coordonnées des vecteurs Ae,, 4e., . .., Ae, dans les bases 
Qu Yo» + + + Qn- Pour définir l’élément a;; de la matrice de l’opéra- 
teur À, il faut appliquer l'opérateur au vecteur e; et prendre la i-ième 
coordonnée de l’image 4e;. Si pour être bref on note {x}; la i-ième 
coordonnée du vecteur zx, alors a;; — {Ae;};. Dans ce qui suit nous 
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utiliserons ce procédé pour définir les éléments de la matrice d'un 
opérateur. 

Considérons un vecteur arbitraire x € X et son image y — Az. 
Elucidons comment s'expriment les coordonnées du vecteur y par 
les ee du vecteur x et les éléments de la matrice de l’opéra- 
teur. Soit 


T— À bje;, y = à Midi. (60.1) 
Calculons 1! 


Az=A ( à be;) = À ÉsAe; = 
J— = 


m nr ñn Vs 
= 2 ë; 2 dijqi = 2 (2 Eja;;) Qi. 
== 1—= 1—= J= 
En comparant les seconds membres de ces égalités au développement 
(60.1) du vecteur y, nous déduisons que les égalités 
2 Gijbj = Mi 

doivent être observées pour i = 1, 2, ..., n, c’est-à-dire 

GE + GyoËo + +. + Gimbm = M1 

G23bs + G2Ë2 +... + GomËm = M2; (60.2) 


Gn1b1 + GnoË2 sp + Anmèm = Mn 


Ainsi, chaque opérateur linéaire, les bases dans les espaces X, Y 
étant fixées, engendre les relations (60.2) qui lient les coordonnées 
de l’image et de l’image réciproque. Pour déterminer les coordonnées 
de l’image d’après celles de l’image réciproque, il suffit de calculer 
les premiers membres de ces relations. Pour chercher les coordonnées 
de l’image réciproque à partir de celles du vecteur y il faut résoudre 
le système d'équations linéaires algébriques (60.2) par rapport aux 
inconnues Ë;, Ec, ..., Em. La matrice de ce système coïncide 
avec la matrice de l’opérateur. 

Les relations (60.2) établissent une liaison profonde entre les 
opérateurs linéaires et les systèmes d'équations linéaires. En particu- 
lier, (60.2) entraîne que le rang d'un opérateur coïncide avec le rang 
de la matrice, la dimension du noyau coïncide avec le nombre de 
solutions fondamentales du système homogène associé. Ce fait con- 
duit d’une façon triviale à la formule (56.4) et à bien d’autres. 

Nous allons utiliser assez souvent cette liaison entre les systèmes 
d'équations linéaires algébriques et les opérateurs linéaires. Mais 
démontrons d’abord qu'il existe une correspondance biunivoque 
entre les opérateurs et les matrices qui déterminent bien les systèmes 
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de la forme (60.2). Nous avons déjà montré que chaque opérateur À, 
les bases étant fixées, définit une certaine matrice 4. Prenons 
maintenant À, une matrice r X m arbitraire. Les bases dans les 
espaces X, Ÿ étant fixées, les relations (60.2) associent à chaque 
vecteur zx € À un vecteur y € Ÿ. On vérifie sans peine que cette 
correspondance est un opérateur linéaire. Construisons la matrice 
de cet opérateur dans les mêmes bases. Toutes les coordonnées du 
vecteur e, sont nulles, à l'exception de la j-ième qui vaut l'unité. 
(60.2) entraîne que les coordonnées du vecteur Àe; coïncident avec 
les éléments de la j-ième colonne de la matrice A+, donc on a 
{Ae;}h; = a;j. Par suite, la matrice de l'opérateur construit coïncide 
avec la matrice initiale À. 

Ainsi, toute matrice nr X m est la matrice d'un opérateur li- 
néaire d’un espace X de dimension m dans un espace Ÿ de dimen- 
sion », les bases de ces espaces étant fixées. On établit par là même 
une correspondance biunivoque entre les opérateurs linéaires et les 
matrices rectangulaires qui a lieu si les bases sont fixées d'une façon 
quelconque. De plus, évidemment, les espaces vectoriels, ainsi que 
les matrices, sont considérés sur le même corps 2. 

Voici quelques exemples. Soit 0 l'opérateur nul. On a 


{0e}: = {0}; = 0. 


Par conséquent, tous les éléments d’une matrice de l'opérateur nul 
sont nuls. Une telle matrice est dite nulle et notée 0. 
Soit maintenant £ un opérateur identique. Nous calculons: 
1, si i=}, 


Eeh=teh=| 0, si ii j. 


Il s'ensuit que la matrice d'un opérateur identique est de la 
forme suivante. C’est une matrice carrée dont la diagonale principale 
se compose d'unités, ses autres éléments étant nuls. La matrice de 
l'opérateur identique est appelée matrice unité et on la note E. 

Nous allons recourir assez souvent à un autre type de matrices. 
Soient À, Àe, - - -» Ân des nombres quelconques du corps 2. Cons- 
truisons la matrice carrée À dans laquelle ces nombres occupent la 
diagonale principale, ses autres éléments étant nuls, c’est-à-dire 


À 0 


(0) À, 


Les matrices de cette forme s'appellent matrices diagonales. Si tous 
les éléments diagonaux sont égaux entre eux, la matrice est dite 
scalaire. En particulier, une matrice unité est une matrice scalaire. 
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Nous dirons également diagonales pour les matrices rectangulaires 
construites d’une façon analogue. Si l’on se reporte aux relations 
(60.2), on établit sans peine en quoi consiste l’action d’un opéra- 
teur linéaire ayant À pour matrice. Cet opérateur « rend À; fois plus 
longue » pour tout i, la i-ième coordonnée de chaque vecteur. 


Exercices 


1. La base 1, t, &*, . .., t"' est fixée dans l’espace des polynômes de degré 
égal au plus à n. Quelle est la forme dans cette base de la matrice de l'opéra- 
teur de dérivation? 

2. Dans un espace X on considère l'opérateur de projection P sur le sous- 
espace S parallèlement à un sous-espace T. Fixons dans X une base quelconque 
formée comme une réunion de Hases des sous-espaces S et 7. Quelle forme ont 
dans cette base les matrices des opérateurs P et Æ — P? 

3. Soit À un opérateur linéaire de X dans Ÿ. Désignons par M le sous- 
espace de X complémentaire du noyau W,, par R, le sous-espace de Y complé- 
mentaire de T4. Comment la matrice de l'opérateur À changera-t-elle si, pour 
choisir les bases de X, Ÿ, on utilise les bases de certains ou de tous les sous- 
espaces indiqués? 


$ 61. Opérations sur les matrices 


Comme nous l'avons montré, tout opérateur linéaire, les bases 
des espaces étant fixées, est défini d’une façon univoque par sa matri- 
ce. C’est pourquoi les opérations sur les opérateurs étudiées plus 
haut, engendrent certaines opérations sur les matrices. Dans les 
questions qui nous intéressent ici, le choix d’une base ne joue aucun 
rôle; aussi, un opérateur et sa matrice seront désignés par la même 
lettre sans indices relatifs aux bases. 

Soient deux opérateurs égaux d’un espace X de dimension m 
dans un espace Ÿ de dimension #7. Le comportement de deux opéra- 
teurs égaux étant identique dans toutes les circonstances, ils auront 
la même matrice. Cela justifie la définition suivante. 

A, B sont deux matrices nr X m aux éléments respectifs a;;, 
b;, dites égales si 

Giy = bi; 


pour i=14,2,...,n; j =1,2,...,m. L'égalité des matrices 
est notée 
A = B. 


Supposons maintenant que deux opérateurs À, B agissent de X 
dans Ÿ. Considérons l'opérateur C = À + B. Désignons respective- 
ment les éléments des matrices de ces opérateurs par c;;, @ij, Dj. 
D'après ce qui a été dit, c;; = {Ce;};. La définition de la somme 
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d'opérateurs et les propriétés des coordonnées des vecteurs par rap- 
port aux opérations sur ces derniers entraïnent 


Ciy={Ce;}: = {(A +B)e;}i = {4e, + Be;}; — 
={A4e;}i + {Bej}i= ai5+ bis. 
Donc: 
On appelle somme de deux matrices À, B de même type nr X m 


aux éléments respectifs a;;, b;; la matrice C de même type aux 
éléments c;;, si 


Ci = Gij + bij 


pour i=1Â,2,...,n; j = 1, 2, ..., m. La somme des matrices 
se note 
C = À + B. 


On appelle différence de deux matrices À, B de même type 
n X m aux éléments respectifs a;y, b;; la matrice C de même type 
aux éléments c;;, Si 


Ci = Gi — Vi; 


pouri=1,2, ..., n;j = 1, 2, ..., m. La différence des matri- 
ces est notée 


C = À — B. 


Considérons un opérateur À de X dans Ÿ et l'opérateur € = ÀA 
pour un certain nombre À. Si a;;, c;, sont respectivement les éléments 
des matrices de ces opérateurs, il vient 


Ci = {Cej}i — {AAe;}; = À {4e}: — Âa;;, 


ce qui nous conduit à la définition suivante: 
On appelle produit d'une matrice À de type 7 X m aux éléments 
a;; par un nombre À la matrice C de même type aux éléments c;;, si 


Cij = ÂAa;j 


pouri=14Â,2,...,n;j = 1, 2, ..., m. Le produit d'une matrice 
par un nombre se note 
C = XA. 


Soient X un espace de dimension nr et Ÿ un espace de dimension m 
sur le même corps P. Comme nous l’avons montré plus haut, pour 
des bases fixées dans X, Ÿ, il y a une correspondance biunivoque 
entre l'ensemble wx7 des opérateurs de X dans Y et l’ensemble 
des matrices 7 X m aux éléments du corps P. Les opérations sur les 
matrices étant introduites conformément aux opérations sur les 
opérateurs, l'ensemble des matrices 7 X m aussi bien que l’ensemble 
Oxyy, est un espace vectoriel. 
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Il est facile d'indiquer l’une des bases de l’espace des matrices. 
Ce sera, par exemple, le système de matrices A‘%” pour À — 


= 1,2,...,n, p = 1,2,..., m, où les éléments ap) de la 
matrice A‘*P sont définis par les ‘égalités 

agp | 4, si i—k, j—=p, 

de O dans les autres cas. 

Dans l’espace w+7 le système des opérateurs aux matrices A‘*P) 


est une base. On en tire que l’espace vectoriel des opérateurs de X 


dans Ÿ est un espace de dimension finie, cette dimension valant le pro- 
duit mn. 


Soient X, Ÿ, Z trois espaces vectoriels, À un opérateur de X 
dans Ÿ, B un opérateur de Ÿ dans Z. Supposons que les dimensions 
des espaces soient respectivement m, nr, p. Admettons que e,, ... 


2 ns tre 26 One Die see Th soient des bases fixées respective- 
ment dans X, Ÿ, Z. L'opérateur À possède une matrice n X m 
aux éléments a;;; de plus, 


n 
Ae;j = >, Gsjs- 
s—=1 
L'opérateur B possède une matrice p X n aux éléments b;; et l’on a: 
P 
Bqs — 2 byarr- 


En examinant la matrice de l'opérateur C — BA, nous constatons 
qu'elle est de type p X m et que ses éléments c;; sont 


Ci = {Ce}: = {BAe;}; = {B ® Gsjgs)}à = 


{À au8a} = {à au ë nr 
= { 2 ( à bysüsj) Tnhi = . À dues 


La formule obtenue suggère la re suivante. 

On appelle produit d’une matrice B detype p X n aux éléments b;; 
par une matrice À de type nr X m aux éléments a;; la matrice C 
de type p X m aux éléments c;;, si 


Cij = ù b;s@s] (61.1) 


pour i = 1,2, ..., p; j = 1, 2,..., m. Ce produit est noté 
C = BA. 
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Ainsi, un produit n’est défini que dans le cas où le nombre de 
colonnes du premier facteur est égal au nombre de lignes du deuxième 
facteur. L'élément de la matrice produit qui se trouve à l'intersection 
de la i-ième ligne et de la j-ième colonne est égal à la somme des 
produits de tous les éléments de la i-ième ligne du premier facteur 
par les éléments correspondants de la j-ième colonne du deuxième 
facteur. 

Rappelons encore une fois qu’il existe entre les opérateurs linéai- 
res et les matrices une correspondance biunivoque. Les opérations 
sur les matrices sont introduites d’après les opérations sur les opéra- 
teurs. C’est pourquoi la multiplication des matrices est associée 
par les relations (58.1) à l’addition des matrices et à la multiplica- 
tion d’une matrice par un nombre. 

Nous avons déjà dit que l’anneau des opérateurs et le groupe de 
tous les opérateurs non dégénérés aggissant dans un espace vectoriel 
sont non commutatifs. Pour le démontrer il suffit évidemment de 
trouver deux matrices carrées À, B telles que AB -£ BA. Soit, par 


exemple, 
1 1 1 0 
HO NES 


2-4 BA 4 À 
AB= |, i) # À 


en démontrant ainsi que la multiplication est non commutative. 

La multiplication des matrices rend commode l'écriture des 
relations de la forme (60.2). Notons zx, la matrice m X 1 composée 
de coordonnées du vecteur z, y, la matrice nr X 1 composée de coor- 
données du vecteur y. Les relations (60.2) seront alors équivalentes 
à une seule égalité matricielle 


On a 


qui correspond à l'égalité opératorielle 
Az = y 


et associe à l’aide de la matrice de l'opérateur les coordonnées d’un 
vecteur et de son image. 

Il importe de noter que, quant à la notation, les égalités matri- 
cielle et opératorielle sont parfaitement analogues, si, bien sür, on 
omet les indices et si on entend par Az le produit de À par zx. La 
notation et les propriétés des opérations sur les matrices et sur les 
opérateurs coïncident, toute transformation de l'égalité opératorielle 
amène une même transformation de l’égalité matricielle. [1 s'ensuit 
que d’un point de vue formel il est indifférent s’il s’agit d'une 
relation matricielle ou opératorielle. 
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Dans ce qui suit nous ne ferons en fait pas de distinction entre 
les égalités opératorielles et matricielles. Bien plus, tous les notions 
et Les faits nouveaux relatifs aux opérateurs seront généralement étendus 
sans mention expresse aux matrices. 


Exercices 


1. Montrer que les opérations sur les matrices sont associées à la transposi- 
tion par les relations suivantes 
(aA) — aA’, (4 + B) = A’ +B', (AB) = B'A', (4') = À. 


2. Montrer que tout opérateur linéaire de rang r peut être mis sous la forme 
d'une somme de r opérateurs linéaires de rang 1 et ne peut pas être mis sous 
la forme d’une somme d'un nombre inférieur d'opérateurs de rang 1. 

3. Montrer que le rang d'une matrice r X m est 1 si et seulement si elle 
peus être mise sous la forme d'un produit de deux matrices non nulles nr X 1 
et 1 X m. 

4. Soient À, B deux matrices qui vérifient l'égalité AC — BC pour toute 
matrice C. Montrer que À = B. 

5. Chercher la forme générale d’une matrice carrée commutant avec une 
matrice diagonale donnée. 

6. Montrer que pour qu'une matrice soit scalaire, il faut et il suffit qu’elle 
commute avec toutes les matrices carrées. 

7. La somme des éléments diagonaux d'une matrice À s'appelle trace 
de la matrice À et se note tr A. Montrer que 

tr A = tr 4’, tr(aA) = a-tr À, 
tr(4 +B)=tr À +tr B, tr (BA) = tr (4B). 


8. Prouver qu’une matrice réelle À est nulle si et seulement si tr (44°) = 0. 


$ 62. Matrices et déterminants 


Les matrices jouent un rôle essentiel dans l'étude des opérateurs 
linéaires. À cet effet on utilise assez souvent un déterminant comme 
moyen auxiliaire. Nous allons examiner quelques questions relatives 
aux matrices et aux déterminants. 

Soit À un opérateur non dégénéré dans X. Son rang coïncide avec 
la dimension de X. D'après les formules (60.2) cela signifie que le 
rang du système de colonnes de sa matrice coïncide avec leur nombre. 
C’est possible si et seulement si le déterminant de la matrice est non 
nul. Ainsi, 

Un opérateur dans un espace vectoriel est non dégénéré si et seulement 
si Le déterminant de sa matrice est différent de zéro. 

La propriété obtenue d'un opérateur non dégénéré justifie les 
définitions suivantes. 

Une matrice carrée est dite non dégénérée si son déterminant est 
différent de zéro et dégénérée dans le cas contraire. 

Evidemment, en s'appuyant sur les propriétés correspondantes 
des opérateurs non dégénérés, nous pouvons dire qu’un produit des 
matrices non dégénérées est encore une matrice non dégénérée, que 
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toutes les matrices non dégénérées forment un groupe multiplicatif, 
que chaque matrice non dégénérée engendre un groupe cyclique, etc. 
La liaison avec les opérateurs non dégénérés permet d'affirmer que 
chaque matrice non dégénérée À possède une matrice unique À”! 
telle que 


A’1A = AA"i—E. (62.1) 


La matrice À”! est dite inverse de la matrice À. 

En utilisant la notion du déterminant on peut exprimer les élé- 
ments de la matrice inverse par les mineurs de la matrice À. A cet 
effet on recourt essentiellement aux formules (40.5) à (40.9). En 
tenant compte de la formule (61.1) pour un élément du produit de 
deux matrices nous constatons que les équations (62.1) sont vérifiées 
par la matrice 


(_A11 A; _Ami_ } 
J D — ce 
A2 A2 Am2 
A1= | à d D | 
_Aim Aom Amm 
d d 


Ici d est le déterminant de la matrice À, À;; le cofacteur de son élé- 
ment a;;. L'unicité de la matrice inverse fait qu'elle ne peut être 
que de ce type là. 

Introduisons des notations abrégées pour les mineurs d’une 
matrice arbitraire À. Le mineur des lignes ë,, i., . .., i, et des 
colonnes jy, Jos + + +» Ïp Sera noté 


rs 7 
Ji J2: ...) Jp 

Nous admettons de plus que la coïncidence de deux indices quel- 
conques de la ligne supérieure (resp. inférieure) de cette notation 
traduit la coïncidence des lignes (resp. colonnes) correspondantes 
du mineur lui-même. 

Théorème 62.1 (formule de Binet-Cauchy). Soit C une 
matrice carrée d'ordre n égale au produit de deux matrices rectangulaires 
À et B respectivement n X metmXn(m>n). Alors 


CA PER 
12...n) 
1 2 nt tes 


7. 
= 2 af, k..….k)]P\ 0 re (62.2) 


1<hi<ho <<... <hn<m 
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Démonstration. Notons a;;, b;;, ci; les éléments res- 
pectifs des matrices À, B, C. D'après la définition du produit des 
matrices, on a 


m 
Cij = » Gis0sj. 
e=i 


En substituant aux éléments de la matrice C leurs expressions et 


en utilisant la linéarité du déterminant par rapport aux vecteurs 
colonnes, on obtient 


m m m 
» Gie1ds11 > Gis0 52 …. > Gisn0snn 
si=1 s2=1 sn=1 


m m m 
21. Ans:0s; 2 Gnss2 . D Ansn0snn 
8 


81—= 2= 


m 
Gisdsst >» G10322 …. 
s2=1 


m m 
no Ans >» AnsDs22 cree » Ansn0snn 
s2=1 sn=1 
m 
Gisdsit Gis2ds22 + - À, Aisn0snn 
— ÿ > deté ----............ = 
S1=1 s2=1 ie 


Ansids11 Ans20 322 .. > Ansndsnn 


m : Fra Gis2s22 - en 
t 


Ans30s11 AnsoD 552 ….. AnsnVsnn 


5 >»..5 af 2 LT) buse +2 ban (62.3) 


St So Sn 


Chacun des indices s,, S:, . .., Sn ne dépend pas des autres et 
peut prendre n’importe quelle valeur de 4 à m ; l'expression obtenue 
est donc une somme de m" termes. Dans cette somme les termes qui 
possèdent au moins deux indices égaux sont nuls du fait que les 
mineurs correspondants de la matrice À sont nuls. Tous les autres 
termes peuvent être classés par groupes de n! termes chacun en ran- 
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geant en un groupe tous les termes dont les valeurs des indices for- 
ment une même collection de nombres. 
Désignons par ki ss 2, 0 les valeurs des indices s,, Se, . .. 
.. Sn rangées par ordre de leur croissance. Soit 


e (S1 Sgs + + Sn) Es (—1)", 


où N est le nombre de transpositions nécessaires pour transformer 
la permutation 53, Se, «+ - ., Sn en la permutation k,, k,, ..., kA. 
Dans les limites d’un groupe de valeurs des indices s,, Se, . . .” 
la somme des termes correspondants de (62.3) est 


af, 2 ...n 
de(s: S2: ts Sn) k, |  - 


Snr 


| Bs11022 ... (PR 


12.7" 
7 + k2...kn à 8 (S4s Sas +1 Sn) Vss10322 + - + Osnn — 


1 2 ...n ki ko ...kn 
=4(,, 7 )e( 2 “| 


La relation obtenue amène la formule (62.2). 

Corollaire. Le déterminant d'un produit de deux matrices 
carrées est égal au produit de déterminants des facteurs. 

La somme de la formule (62.2) se compose dans notre cas d’un 
seul terme. Donc 


c 12:.:n ASS B 12...n 
12n) “et 12...nJ 
ou, ce qui revient au même, 


det C = det À -det B. 


Corollaire. Soit C une matrice carrée d'ordre n égale au 
produit de deux matrices rectangulaires À et B respectivement n X m 
etm xXn(m<n). Alors, det C = 0. 

En effet, ajoutons, à chacune des matrices À et B, n — m der- 
nières colonnes nulles et, respectivement, n — m lignes nulles. 
On obtient alors deux matrices carrées d'ordre » et de déterminants 
nuls. Le produit de ces matrices est la matrice C. Donc, d’après le 
premier corollaire, det C = 0. 


Exercices 


1. dns que pour toute matrice À non dégénérée on vérifie l'égalité 
A1) = (4')-1. 

2. Montrer que pour toute matrice À non dégénérée a lieu l'égalité 
det (4-1) — (det A)-1. 

3. Prouver que toute matrice carrée À d'ordre n vérifie l'égalité det (a) — 
= a".det À. 
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4. Montrer que si deux matrices carrées À, B vérifient l'égalité AB — E, 
alors À est une matrice non dégénérée et B — "A 

5. Ecrire la formule de la forme (62.2) pour un mineur quelconque d'un 
produit de deux matrices. 

6. Montrer que pour toute matrice réelle À tous les mineurs principaux 
des matrices A’A et A4’ sont non négatifs. 

7. Prouver que le rang d’un produit des matrices ne dépasse pas le rang 
de chacun des facteurs. 


8. Montrer que la multiplication par une matrice non dégénérée ne change 
pas le rang. 


$ 63. Changement de base 


Les bases étant fixées, l'égalité matricielle permet de réaliser 
une exploration complète d’un opérateur linéaire. Une telle étude 
est évidemment d'autant plus efficace, que la forme de la matrice 
est plus simple. Dans le cas général, les matrices d'un opérateur 
dépendent de bases et notre tâche immédiate consiste à élucider cette 
dépendance. 

Soient ej, a, + - -, Em €t far Jes + + <> fm) deux bases d'un même 
espace X de dimension m. Les vecteurs f,, fe, . . ., fm sont bien 
définis par leurs décompositions 


f1= Puei À Paseo + +. + Dim 
Î2 = Pi201 + P2r€2 + -. . + Dm2€ms 


Îm = Pim£i + Pamee + + +: + Pmmêm 


suivant les vecteurs e,, e:, . .., em. Les coefficients psy déterminent 
la matrice - 


(63.1) 


Pi P12 ee Pim 
D — P2i Po2z ee Pom 


Pmi Pm2 -.: Pmm 


Cette matrice s'appelle matrice de changement de base ou matrice de 
passage de la base e,, e., . .., en à la base f,, fa, . . ., fm. 

Décomposons un vecteur arbitraire x € À suivant les vecteurs 
de deux bases. Soit 


m 


— à QUE UITÉE 
i=1 i=1 


D'après (63.1), on a 


LL m m 
à Eie; = à Nifi = À % 2 À puey= à (È Ti Pa) Ej—= È NP) €;. 
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En comparant les coefficients de e,; du premier et du second membre 
on trouve 


E = ZA Pins (63.2) 


pour à = 4, 2, ..., m. Ce sont les formules de changement de base. 
Désignons comme auparavant par x. et x; les matrices m X 1 compo- 
sées de coordonnées du vecteur zx dans les bases correspondantes. 
Les formules (63.2) montrent que 


Te — Pz;. (63.3) 


La matrice de changement de base doit être non dégénérée, car 
s’il n’en est pas ainsi, on aura une dépendance linéaire entre ses 
colonnes et, par conséquent, entre les vecteurs f,, fa, . . ., fm. 
Toute matrice non dégénérée est, evidemment, une matrice de 
changement de base définie par l'égalité (63.3). En multipliant l’éga- 
lité (63.3) à gauche par la matrice P-!, on obtient 


Li = PT'L;; 


Soient maintenant e,, @:, . « .» @m3 far for + + +» fm ©t lys los ©» « 
ss lm trois bases dans un espace vectoriel X. Le passage de la 
première base à la troisième peut se faire de deux façons, soit 
directement de la première à la troisième base, soit d’abord de la 
première à la deuxième, puis de la deuxième à la troisième. On 
établit sans peine la relation entre les matrices correspondantes. 
D'après (63.3), on a 

Te = Pry, 2x = Rz,, x = Szx.. 
Les deux premières relations entraïnent 


zx, = Pr; = P(Rx,) = (PR) x,, 
d’où 
S = PR. 


De la sorte, en procédant de proche en proche aux changements de 
base, la matrice du changement résultant sera égale au produit de 
matrices de ces changements successifs. 

Examinons de nouveau l'opérateur linéaire À de X dans Y. 
Choisissons dans l’espace X deux bases e,, ..., em, fi, - - «» fm: 
et dans l’espace Ÿ deux bases qy, . . ., Qns lis + + +, in. Au même 


opérateur À dans le premier couple de bases correspond l'égalité 
matricielle 


Ya = AgeTes (63.4) 
et dans le deuxième couple, 


= Ati. (63.5) 
14—01090 
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Conformément à ces couples de bases, on a pour un même opérateur À 
deux matrices À et Ary. 
Notons P la matrice de passage de la base e,, . .., em à la base 


far + + +» Îfmr Q la matrice de passage de qy, . .., Qn à dy, . . …, ln. 
On a 


Ze = Pt}, Ye = Qyt. (63.6) 
En portant ces expressions de z., y, dans (63.4), on obtient 
Qyr = AgePt1, 


yr=(QAgeP) ty. 
La comparaison de l'égalité obtenue avec (63.5) fait constater que 
A1; — QAgeP. (63.7) 


C'est précisément la relation recherchée entre les matrices d’un même 
opérateur dans des bases différentes. 


d’où 


Exercices 


4. Montrer que le rang de la matrice d'un opérateur ne varie pas lorsqu'on 
change de base. 

2. Montrer que le déterminant de la matrice d’un opérateur dans un espace 
vectoriel ne dépend pas du choix d'une base. 

3. Quelle correspondance peut être établie entre les opérateurs non dégé- 
nérés dans un espace X et les changements de base dans ce même espace? 

4. Disons que deux bases d’un même espace sont de même orientation 
si le déterminant de la matrice de changement de base est positif. Prouver 
que toutes les bases peuvent être partagées en deux classes de bases de même 
orientation. 

5. Disons que les bases d’une classe de même orientation sont à gauche 
et celles de l’autre à droite. Comparer ces classes avec celles du & 34. 


$ 64. Matrices équivalentes et semblables 


A chaque opérateur linéaire À d’un espace X dans un espace Y 
correspond l’ensemble de ses matrices défini par la possibilité de 
choisir des bases différentes dans X et Y. La structure d'un tel 
ensemble diffère foncièrement suivant que À se confond avec Y 
ou non. 

Deux matrices rectangulaires de même type sont dites équivalentes 
s'il existe deux matrices carrées non dégénérées R et S telles que 


B = RAS. 
Il résulte de (63.7) que les matrices d'un même opérateur, les 


bases choisies dans X et Ÿ étant différentes, sont toujours équiva- 
lentes entre elles. On montre aisément que la réciproque est égale- 
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ment vraie. Plus précisément, dans des bases dûment choisies, deux 
matrices équivalentes sont toujours des matrices du même opérateur 
linéaire. De cette façon, à chaque opérateur linéaire de X dans Ÿ est 
associée une classe des matrices équivalentes. | 

Théorème 64.1. Pour que deux matrices rectangulaires de 
même type soient équivalentes, il faut et il suffit qu'elles aient le même 
rang. 

Démonstration. Lorsqu'on multiplie une matrice par 
des matrices non dégénérées, son rang ne change pas; il en résulte 
que le rang des matrices équivalentes est le même. Soient, mainte- 
nant, deux matrices de même type et de même rang. Prouvons qu’el- 
les sont équivalentes. Nous prouverons même que chaque matrice 
de rang r est équivalente à la matrice 


10...0 0...0) 
01...0 0 0 
00...1 0...0 
BH |00...0 o...ol 
00...0 0...0 
( 
Soit une matrice rectangulaire z X m. Elle définit un opérateur 
linéaire À d’un espace À à base e,, e, ..., en dans un espace Y 
à base q, Qe, . .., Qn. Désignons par r le nombre de vecteurs li- 


néairement indépendants parmi les vecteurs Ae,;, 4e., ..., Ae,: 
Sans restreindre la généralité, on peut admettre que les vecteurs 
Ae;, Ae:, . .., Ae, soient linéairement indépendants, puisqu'on 
peut l’obtenir en numérotant convenablement, les vecteurs de la 
base. Les vecteurs restants Ae,+,, . .., 4e, s'expriment linéaire- 
ment par les vecteurs précédents 


Ae,= © cyj4e; (64.1) 
Cr 


pour k = r + 1, ..., m. Déterminons la nouvelle base j,, fa, ... 
..) Îm dans À de la façon suivante 


Eh k= 1, 2, ss, 


fn = (64.2) 


ex— D che k=r+1, :..,m. 
j=1 


14° 
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Alors, en vertu de (64.1), 


Afn = 0 (64.3) 
pour À =r<+1,..., m. Posons ensuite 

Af; = l; (64.4) 
pour j = 1, 2, ., r. Par hypothèse, les vecteurs £,, &, ..., £, 


sont linéairement indépendants. Complétons-les par certains vecteurs 
lotir + - ên jusqu'à une base dans Ÿ et considérons la matrice de 
l'opérateur A dans les nouvelles bases f,, ..., fm et £y, . . ., fn. 
Les coefficients de la k-ième colonne de cette matrice nou avec 
les coordonnées du vecteur Af, dans la base £,, ..., t,. D'après 
les js (64.3), (64.4), la matrice de l'opérateur À coïncide 
avec 

La matrice initiale et la matrice Z, correspondent au même 
opérateur, et de ce fait elles sont équivalentes. Toutes les matrices 
d. même rang sont donc équivalentes à 7, et, par conséquent, entre 
elles. 

Tout en démontrant le théorème, nous avons répondu à une 
question très importante, à savoir: « Comment choisir les bases dans 
Les espaces X et Y pour que la matrice d’un opérateur linéaire soit La 
plus simple? » En outre, nous avons indiqué le type explicite de 
cette matrice. 

Une réponse aussi simple et efficace a été possible parce que l'on 
pouvait choisir indépendamment les bases dans X et dans Y. Soit 
maintenant À un opérateur dans un espace X. Evidemment, cette 
fois encore on pourrait examiner les images directes et réciproques 
dans des bases différentes, mais cette façon de procéder ne serait 
plus naturelle ici du fait que les images directes et réciproques appar- 
tiennent au même espace. L'utilisation des bases différentes com- 
pliquerait sensiblement l’étude de l'opérateur. Si la base est unique, 
les matrices P et Q de (63.6) coïncident. Par conséquent, à chaque 
opérateur linéaire dans un espace vectoriel _correspond une classe 
des matrices vérifiant la relation 


B= PAP (64.5) 


pour toutes les matrices P non dégénérées. On dit que ce sont des 
matrices semblables, la matrice P s’appelant matrice de la transforma- 
tion de similitude. 

La question des conditions dans lesquelles deux matrices peuvent 
être semblables est assez compliquée et la réponse y sera donnée 
dans ce qui suit. Tout aussi compliquée est la question du type le 
plus simple des matrices semblables. Ces problèmes feront l’objet 
de deux chapitres suivants. 
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Exercices 


1. Montrer que l’équivalence des matrices et leur similitude sont des 
relations d'équivalence. 

2. Prouver que les matrices semblables possèdent la même trace et le 
même déterminant. 

3. Montrer que pour une même transformation de similitude un groupe 
cyclique des matrices non dégénérées se transforme en un groupe cyclique. 

4. Montrer que pour une même transformation de similitude, un sous- 
ce d’un espace vectoriel de matrices se transforme en un sous-espace vec- 
toriel. 

5. Considérons sur l’ensemble des matrices carrées de même ordre l'opé- 
rateur de la transformation de similitude avec une matrice fixe. Montrer que 
cet opérateur est linéaire. 

6. Montrer que l'ensemble de tous les opérateurs de transformation de 
similitude donnés sur un ensemble des matrices carrées de même ordre engendre 
un groupe multiplicatif. : 


CHAPITRE 8 


POLYNOME CARACTÉRISTIQUE 


$ 65. Valeurs propres et vecteurs propres 


Soit À un opérateur linéaire dans un espace X. Cela signifie qu'à 
chaque vecteur z € À on associe un vecteur y — Az de ce même 
espace X. Il peut s'avérer que pour un certain vecteur non nul zx, 
son image lui est colinéaire. Nous allons voir dans ce qui suit que 
cette situation permet de simplifier sensiblement l'étude d’un opé- 
rateur. 

Un nombre À est appelé valeur propre, et un vecteur non nul z 
vecteur propre d’un opérateur linéaire À s'ils vérifient la relation 
Az = }z 

Constatons que si x est un vecteur propre associé à la valeur 
propre À, tout vecteur colinéaire œz, pour &« 0, est également un 
vecteur propre. Si à une valeur propre À correspondent deux vecteurs 
propres z, y, tout vecteur non nul de la forme ax + fy est également 
un vecteur propre. Par définition, le vecteur nul n'est pas un vecteur 
propre. C’est pourquoi l’ensemble X, de tous les vecteurs propres, 
combinaisons linéaires d’un nombre quelconque de vecteurs propres 
données associés à une même valeur propre À, n’est pas un sous-espace. 
Mais si nous complétons X, par le vecteur nul, on obtient un sous- 
espace. Ce dernier s’appelle sous-espace propre de l'opérateur À 
associé à la valeur propre À. 

: On comprend sans peine que les vecteurs propres des opérateurs 0, 
E et &«ËE sont tous des vecteurs non nuls de l’espace X. Ces opérateurs 
ne possèdent chacun qu’une seule valeur propre égale respectivement 
à O0, 1 ou &, et donc au moins un sous-espace propre coincidant avec 
l’espace X tout entier. Un opérateur de projection P possède deux 
ensembles des vecteurs propres: tous les vecteurs du domaine des 
valeurs de l’opérateur P et tous les vecteurs du domaine des valeurs 
de l'opérateur £ — P. Au premier ensemble des vecteurs propres 
est associée la valeur propre À = 1, et au deuxième À = 0. En effet, 
étant donné que P* = P, il vient 


P (Pzx) = P°z = Pz = 1-Pz, 
P((E—P)z)=(P— P)z=(P — P)z=0—=0.(E — P) x. 
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Par conséquent, un opérateur de projection possède au moins deux 
sous-espaces propres. 

Théorème 65.1. Un système de vecteurs propres x], ..., Im 
d'un opérateur À associés à des valeurs propres distinctes deux à deux 
Ms Àos + + +1 Am est linéairement indépendant. 

Démonstration. Les vecteurs propres sont par définition 
des vecteurs non nuls, le théorème est donc immédiat pour m = 1. 
Supposons qu’il soit vrai pour tout système de m — 1 vecteurs 
propres, mais qu'il ne le soit plus pour les vecteurs z1, Z+, . . ., Zm- 
Le système de ces vecteurs sera alors linéairement dépendant, c'est-à- 


dire pour certains nombres &;, &, ..., äm non simultanément 
nuls on a l'égalité 
AT + Lola +... + Amtm = 0. (65.1) 


Supposons que «&;, 0. En appliquant À à (65.1), on obtient 
ŒATy + LoÂoTa + «ee + EmÂmTm = 0. (65.2) 


En multipliant (65.1) par À, et en retranchant le résultat obtenu 
de (65.2), on trouve 


Qi (Ai — Âm) Ti + Ga (Â2 — À) Lo + +0 + m1 (Ami — Âm) Tm-1 = 0. 


On en tire d’après l'hypothèse de récurrence que tous les coefficients 

affectés aux vecteurs Zj, Tes « - -y Tm-1 Sont nuls. En particulier, 

y (4 — Âm) = 0, ce qui contredit la condition À, À, et l’hypo- 

thèse «, -<0. Par conséquent, le système des vecteurs zx,, ze, ... 
> Tm 6St linéairement indépendant. 

Corollaire. Tout opérateur linéaire dans un espace de dimen- 
sion m ne peut avoir plus de m valeurs propres distinctes deux à deux. 

Le cas où dans un espace de dimension m un opérateur À possè- 
de m valeurs propres distinctes deux à deux présente un intérêt 
particulier. D’après le théorème 65.1, nous pouvons alors choisir 
une base de l’espace composée entièrement de vecteurs propres 
de l'opérateur À. 

On dit qu’un opérateur linéaire À dans un espace X de dimen- 
sion m est un opérateur de structure simple s'il possède m vecteurs 
propres linéairement indépendants. 

L’explication du fait que parmi tous les opérateurs linéaires 
nous dégageons les opérateurs de structure simple n’a rien du mystère. 
Ces opérateurs et seulement eux possèdent, dans une certaine base, 
des matrices diagonales. En effet, soient x,, x, . . ., x, les vecteurs 
propres linéairement indépendants de l'opérateur A. Prenons-les 
comme vecteurs de base de l’espace À et construisons la matrice de 
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l'opérateur À dans cette base. On a 


At: = Ait: 
Atz= ht: 
An = Antme 


Rappelons que les éléments d’une colonne de matrice de l’opéra- 
teur représentent les coordonnées de l’image d’un vecteur de base. 
C’est pourquoi la matrice À, de l'opérateur À dans la base des vec- 
teurs propres est de la forme 


A4 O ... 0 
= 0 A... 0 | 
0 0...» 


Si à présent dans une certaine base z,;, z,, . .., zm un opérateur À 
possède une matrice diagonale, dont la diagonale principale est 
composée des nombres quelconques non strictement distincts À, 
À, .. A alors 2, Toy + + +» Tm SOnt des vecteurs propres de 
l’opérateur À associés aux valeurs propres À;, À, . .., Àm respecti- 
vement. 

Ainsi, les opérateurs de structure simple et seulement eux possè- 
dent, dans une certaine base, des matrices diagonales. Cette base 
peut être composée seulement de vecteurs propres de l’opérateur À. 
Tout opérateur de structure simple intervient toujours en « étendant » 
les coordonnées d’un vecteur dans la base donnée. Si tous les opéra- 
teurs linéaires étaient de structure simple, la question du choix 
d’une base dans laquelle une matrice de l’opérateur serait la plus 
simple sera résolue définitivement. Quoi qu’il en soit, les opérateurs 
de structure simple n'épuisent pas tous les opérateurs linéaires. 


F— 
Exercices 


4. Soit À un opérateur possédant un vecteur propre x associé à une valeur 
propre À. Montrer que pour l'opérateur a@o£ + a;jA + ... + a,A'", où 
Œ0y Œys + + + En Sont des nombres, le vecteur x sera également propre, mais 
associé à la valeur propre ao + @Ay + ... + anÀ". 

2. Montrer que les opérateurs À et À — aËE ont les mêmes vecteurs propres 
quel que soit l'opérateur À et le nombre a. 

3. Montrer qu'un opérateur À est non dégénéré si et seulement s'ilne 
possède pas des valeurs propres nulles. 

4. Prouver que les opérateurs À et 4-1! ont les mêmes vecteurs propres 
p our tout opérateur À non dégénéré. Comment les valeurs propres de ces opera- 
teurs sont-elles liées entre elles? 

5. Montrer que si un opérateur À est de structure simple, l'opérateur 
a 0E + a;,A + ... + a,A'" est également de structure simple. 
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6. Prouver que l'opérateur de dérivation dans l’espace des polynômes n'est 
pas un opérateur de structure simple. Trouver les vecteurs propres et les valeurs 
propres de cet opérateur. 

7. Considérons un opérateur de la transformation de similitude à matrice 
diagonale. Montrer que c'est un opérateur de structure simple. Trouver tous 
ses vecteurs propres et valeurs propres. 


$S 66. Polynôme caractéristique 


Les opérateurs linéaires ne sont pas tous à posséder ne serait-ce 
qu’un seul vecteur propre. Supposons, par exemple, que dans l'espace 
V, un opérateur agit en tournant chaque segment orienté autour de 
l’origine des coordonnées d’un angle de 90° dans le sens opposé à 
à celui des aiguilles d’une montre. Dans ce cas, évidemment, un 
vecteur et son image ne sont jamais colinéaires et l'opérateur ne 
possède aucun vecteur propre. Pour étudier l'existence des vecteurs 
propres, déduisons d’abord une équation vérifiée par toutes les 
valeurs propres d'un opérateur linéaire. 

Soit À un opérateur linéaire dans un espace X de dimension m 
donné sur le corps P. Si l’opérateur possède une valeur propre À 
associée à un vecteur propre x, alors, par définition, la relation Az — 
— Àx est respectée, ou, ce qui revient au même, 


(LE — A)z = 0. (66.1) 


Le vecteur x étant non nul, (66.1) implique que l'opérateur ÀE — A 
est dégénéré. Ainsi, les valeurs propres de l’opérateur À sont ceux 
et seulement ceux des nombres À de P pour lesquels l’opérateur 
ÀE — À est dégénéré. 

Fixons dans l'espace X une base e,, €, . .., em et désignons 
par À, la matrice de l'opérateur À dans cette base. L’opérateur 
ÀE — A est dégénéré si et seulement si sa matrice ÀE — À, est 
dégénérée, c'est-à-dire si 


C det (AE — À.) = 0. (66.2) 


La définition des valeurs propres n'était pas liée au choix d'une 
base dans l’espace X. Les nombres À du corps P vérifiant l'équation 
(66.2) ne doivent donc pas non plus dépendre de la base. En fait, 
quel que soit À, c'est le premier membre de (66.2) qui ne dépend pas 
du choix d'une base, bien que formellement cette dépendance est 
enregistrée. Soit dans une autre base f,, f, . . ., fm la matrice À, 
de l'opérateur À. D'après (64.5), les matrices À, et À; sont liées 
par la relation 


A;= Q"A.Q 


218 POLYNOME CARACTERISTIQUE (CH. 8 


pour une matrice Q non dégénérée. À présent, pour tout À de Pona 
det (ÀE — À,)= det (ÂQ071EQ — Q"14,0) — 
— det (Q"I(AE — À.) Q) = det Q"1 det (AE — À.) det Q — 
— (det Q)"{ det (AE — À.) det Q = det (AE — 4.). 


En tenant compte de l’expression du déterminant d’une matrice 
par ses éléments, on voit aisément que le premier membre de (66.2) 
peut être mis sous la forme 


det(A£ — 4,)=a,+ait...+amaATt + anAT. (66.3) 


Les coefficients ay, . . .; Am Se calculent d’après les éléments de la 
matrice À, et ne dépendent pas de À. Le degré maximal de À n’inter- 
vient que dans le produit des éléments diagonaux de la matrice 
ÀE — À,, donc 
Am = 1. 
Voici les expressions explicites de deux autres coefficients : 
a)=(—1)" det 4, ami = —tr 4e. 


En général on peut supposer qu’en développant par des procédés 
différents le déterminant det (ÀE — À,) suivant les puissances de À, 
on obtienne des expressions de la forme du second membre de (66.3), 
mais à coefficients a, différents. Pourtant, dans ce qui suit, nous 
montrerons que cette hypothèse est fausse. Les coefficients du second 
membre de (66.3) ne dépendent pas du mode de leur calcul. En tenant 
compte de l’indépendance du déterminant det (ÀE — À.) de la base, 
nous constatons que tous les coefficients &p, . . ., Am-1 Sont en fait 
des caractéristiques de l’opérateur À. La fonction 


f(A)= a+ a+ ami AT (66.4) 


est appelée polynôme caractéristique de l'opérateur À. 

A chaque opérateur linéaire on associe un polynôme caractéristi- 
que. La réciproque a également lieu. Chaque polynôme de la forme 
(66.4) est caractéristique pour un opérateur linéaire. Ce dernier 
peut être, par exemple,. un opérateur dont la matrice À, dans une 
base quelconque s'écrit : 


— Ami —Am-2c. — 4j —U 
À 0 . 0 0 

A;= 0 4  ... O0 0 : (66.5) 
0 0 ... 1 0 


La vérification est immédiate si on utilise le théorème de Laplace 
pour le calcul du déterminant det (ÀE — À,). Une matrice (66.5) 
s'appelle matrice de Frobenius. 
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Pour qu’un nombre À du corps P soit une valeur propre d’un 
opérateur À, il faut et il suffit qu’il satisfasse à l’équation 


Go + À + + LamiArtit AT =0, 


c'est-à-dire qu’il soit racine de son polynôme caractéristique. On 
ne peut pas dire que pour tout corps P tout polynôme à coefficients 
dans P possède au moins une racine de P. Un exemple peut en être 
fourni par le polynôme À* + 1 qui ne possède pas de racine dans 
le corps des nombres rationnels, ni dans celui des nombres réels. 

Un corps P est dit algébriquement clos si n'importe quel polynôme 
à coefficients dans P possède au moins une racine dans P. 

De cette façon, si un opérateur linéaire agit dans un espace donné 
sur un corps algébriquement clos, il possède nécessairement au moins 
un vecteur propre. On peut construire toutes sortes d'exemples des 
corps algébriquement clos, mais ce n’est que l’un d’entre eux, le 
corps des nombres complexes, qui présente surtout de l’intérêt pour 
la pratique. Nous démontrerons donc dans ce qui suit que ce corps 
est algébriquement clos. 


Exercices 


1. Trouver les polynômes caractéristiques des opérateurs nul et identique. 

2. Trouver le polynôme caractéristique de l'opérateur de dérivation. 

3. La coïncidence des polynômes caractéristiques témoigne-t-elle de l'éga- 
lité des opérateurs? 


4. Montrer que les opérateurs aux matrices À et 4” ont les mêmes polynô- 
mes caractéristiques. 


5. Soit dans une base un opérateur à matrice (66.5). Trouver les coordon- 
nées des vecteurs propres dans cette même base. 
6. Prouver qu'un opérateur à matrice (66.5) est de structure simple si et 


a si son polynôme caractéristique possède m racines distinctes deux 
à deux. 


$ 67. Anneau des polynômes 


Dans certains exercices et exemples nous avons déjà attiré l’at- 
tention sur les propriétés algébriques des polynômes. Nous allons 
poursuivre cette discussion pour le cas des polynômes caractéristiques. 

Soit P un corps arbitraire. Considérons l’ensemble des polynô- 
mes, c’est-à-dire des fonctions de la forme 


f()=a+az+...+ a (67.1) 


dont les coefficients as, . . ., a et la variable indépendante z pren- 
nent des valeurs dans ?. Adoptons donc que f (z) est un polynôme 
de degrénsia, = 0, alors que les coefficients de plus grands numéros 
sont nuls. Le seul polynôme privé de degré défini est celui dont tous 
les coefficients sont nuls. Nous dirons que c’est le polynôme nul 
et noterons-le (0. 
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Deux polynômes seront dits égaux si tous les coefficients affectés 
aux mêmes degrés de la variable indépendante sont égaux. 

Soient maintenant f (z) et g (z) deux polynômes des degrés nets 
respectivement. Notons 


f(z)=a+az+ ...+an2 + az", | 
Lg (2) =db0+b2+ ... +bs-12" 1 + bsz° 
et supposons pour fixer les idées que r > s. Appelons somme f (z) + 
+ g (z) des polynômes f (2) et g (z) le polynôme 
f(z)+g(z)=co+cz+ ...+en2 + cz", 


où C3 = &i + b, pour i <s et c; = a pour i >s. Le degré de la 
somme des RO VC UIPE" est n sin >5s, mais pour z = s il sera plus 
petit que nr si b, 

On appelle Droduit J Î ‘) -g (z) des polynômes f (z) et g (z) le poly- 
nôme 


(67.2) 


Î (z)-8 (z) = d + diz +... + da+s- 1277 1+ dn+s2"* 


où 
di; = à _Gnb: 
R+l=i 
pour à = 0, 1, ..., nr + s. Le coefficient d; est la somme des pro- 


duits de ceux des coefficients des polynômes f (z) et g (z) dont la 
somme des indices est i. Par exemple, 


d = 409) dn+s = ah0s . 


Cette dernière égalité entraîne que d,+, == 0, c’est pourquoi le 
degré du produit des polynômes non nuls est égal à la somme des 
degrés des facteurs. Il s'ensuit que le produit des polynômes non nuls 
est un polynôme non nul. 

Un cas particulier du produit des polynômes est le produit af (z) 
d'un polynôme f (z) par ur nombre «, puisqu’un nombre non nul peut 
être envisagé comme polynôme de degré nul. 

L'ensemble des polynômes avec les opérations ci-introduites est 
un anneau commutatif. Nous n'’allons pas nous attarder à vérifier les 
axiomes. 

Théorème 67.1. Pour tout polynôme f (z) et pour un poly- 
nôme non nul g (z) on peut trouver des polynômes uniques q (z) et r (z) 


tels que 
f() =8()g() +r(), (67.3) 


et que ou bien le degré de r (z) soit inférieur à celui de g (z) ou bien 


r (z) = 
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Démonstration. Soient f (z) et g (z) deux polynômes de 
degrès n et s. Si n <s ou f (z) = 0, dans le développement (67.3) 
on peut poser g(z) = 0, r(z) = f (2). Supposons donc que nr >s. 

Mettons les polynômes f (2) et g (2) sous la forme (67.2) et posons 


fe) 2e (2) = fi). (67.4) 
Soient n, le degré du polynôme f, (z) et a£? son coefficient dominant. 
Il est clair que n, << r,. Si rm > s, posons 
b{1) 
fa Ce) — ang (2) = fa (2). (67.5) 
Désignons maintenant par nr. le degré et par af le coefficient domi- 
nant du polynôme }j, (z). Si nr. > s, posons encore 


a 
{2 (2) ——5 278 (z) = fs (2), (67.6) 


etc. 
Les degrés des polynômes f, (z), fa (z), . . . décroissent. Aussi, 
après un nombre fini de pas, aboutit-on à l'égalité 
atk-1) 


În-1 (2) — = 2nA g (2) = fa (2), (67.7) 


où le polynôme f, (z) soit ou en nul, ou bien d’un degré n, infé- 
rieur à s. Là le processus s’achève. 
En additionnant maintenant toutes les égalités de la forme (67.4) 
à (67.7), on obtient 
(1) a 


FC (ea amet ae) (2) = fa (2). 
Cela signifie que les polynômes 


r (z) = fr (z) 


vérifient l'égalité (67.3); de plus r (z) = 0, ou bien le degré de r (z) 
est inférieur à celui de g (2). 

Prouvons maintenant l’unicité des polynômes g (2) et r (z) figu- 
rant dans l’énoncé du théorème. Supposons qu'il existe, en plus, 
des polynômes g° (z) et r’ (z) tels que 


fG) =8()o (G)+7r (); 
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et que ou bien r’ (z) = 0, ou bien le degré de r’ (z) soit inférieur 
à celui de g (z). Il vient 


8 () (g() — g()) = r° () —r (). (67.8) 


Le polynôme du second membre de cette égalité est nul ou bien 
son degré est inférieur à celui de g (z). Quant au polynôme du premier 
membre, pour g(z) — qg’ (2) 0, son degré est au moins égal 
: celui de g (z). C’est pourquoi l'égalité (67.8) n’est possible que dans 

e cas où 


g() =), rG)=r (). 


Le théorème est complètement démontré. 

On dit que le polynôme g (z) est le quotient de f (z) par g (z) et 
que r (2) est lereste de cette division. Si le reste est nul, nous dirons 
que f (z) se divise par g (z), alors que le polynôme g (z) lui-même 
s'appelle dans ce cas diviseur de polynôme f (2). 

Examinons la division d’un polynôme non nul arbitraire f (z) 
par un polynôme du premier degré z—a.Ona 


fG=(G—-a)a()+r(). (67.9) 


Le degré de r (z) devant être inférieur à celui de z — a, r (z) est un 
polynôme de degré nul, c’est-à-dire une constante. Cette constante 
se définit sans peine. En portant dans le premier et le second membres 
de la relation (67.9) z = a on trouve que r (z) = f (a). Donc 


fe) = ( — a) q (e) + f (a). (67.10) 


Pour qu'un polynôme f (z) se divise par le polynôme z — a, 
il faut et il suffit que f (a) = 0. Les nombres a tels que f (a) = 0 
s'appellent racines ou zéros du polynôme f (2). De la sorte, chercher 
tous les diviseurs du premier degré d’un polynôme équivaut à obtenir 
toutes ses racines. 

La formule (67.10) permet de tirer la conclusion suivante. Pour 
tout nombre a de P, un polynôme f (z) de degré n peut être mis d’une 
façon unique sous la forme de développement suivant les puissances 
de (z — a): 


f(z)= Ao+ Ai(z—a)+...+Ans(2—a) 1+4,(2—a)", (67.11) 


où As, ..., À, sont des nombres de 2. 

Il est relativement simple d'établir l'existence au moins d’un 
développement. En divisant f (z) par (z — a) on obtient le quotient 
G (z) et le reste À, liés par l’égalité 


f() = G — a) g (2) + 40. (67.12) 
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Si le degré de g (z) est nul, on a le développement (67.11). Mais si 
le degré de (67.11) est différent de zéro, en divisant q, (z) par (z — a) 
on obtient 


a (z) = (z — a) g: (2) + Ai. (67.13) 
En associant (67.12) et (67.13), on trouve 
f() = (2 — a)° qe (2) + A1 (2 — a) + A4. 


Si la nécessité se présente, on divise encore g. (z) par (z — a), etc. 
Puisque les degrés des quotients q (z), q2 (z), . .. décroissent, le 
processus s'arrête après z pas pour donner le développement (67.11). 

Supposons maintenant qu'un développement de cette même 
forme s’obtienne par un autre moyen quelconque et que ses coeffi- 
cients soient À,, ..., 4. En désignant 


qi(z)= A+ A$31(c—a)+...+4,(2— a)" 
pour i = 0, 1, ..., n, on constate que 
qi(z)=(2— a) gi+s (2) + Ai, (67.14) 


et que gg, (z) = f(z). En comparant (67.12) et (67.14) pour i = 0 
et en tenant compte de l’unicité du quotient et du reste, nous cons- 
tatons que À, = À, g (z) = g(z). On démontre d’une façon 
analogue l'égalité des autres coefficients. 


Exercices 


4. Montrer que dans l'anneau des polynômes il n’y a pas de diviseurs de 
Zéro. 

2. Soient certains polynômes dre l'égalité f (z) @ (z) = g (z) o (z)- 
Montrer que si p (z) £ 0, alors f (z) — 

3. Prouver que chacun des deux polynômes non nuls f (z) et g (z) se divise 
rat à reste par l'autre si et seulement si g (z) — af(z) pour un nombre non 
nul «. 

4. Supposons que chacun des polynômes f, (2), ..., f, (z) se divise par 
p (z). Montrer que le polynôme f, (2) g1 (2) +. . - + fn (2) gn (2), où g1 (2), . .. 

.-., 8 (z) sont des polynômes arbitraires, ge ivise également par  (z). 

5. Montrer que dans les développements (67.1), (67.11) d'un même poly- 

nôme f(z) les coefficients a, et A4, coïncident. 


$ 68. Théorème fondamental de l’algèbre 


Nous abordons la démonstration d’une des propositions princi- 
pales qui affirme que le corps des nombres complexes est algébrique- 
ment clos. Ce théorème est appliqué dans des domaines les plus variés 
des mathématiques. En particulier, il est à la base de toute la théorie 
ultérieure des opérateurs linéaires. Par tradition, nous l’appelons 
théorème fondamental de l'algèbre. 
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Ainsi, il nous faut démontrer que tout polynôme de degré n > 1 
à coefficients complexes possède au moins une racine, en général 
complexe. Considérons d’abord les polynômes d’une forme spéciale. 
Notamment, 


f(2)=a—z. (68.1) 

Mettons les nombres complexes sous une forme dite trigonométri- 

que 
z = r (cos p + i sin y). 
Ici r est un nombre non négatif appelé module du nombre z, q un 
nombre réel appelé argument du nombre z. Il est clair que pour tout 
nombre z le module est défini d’une façon univoque. Pour des 
nombres non nuls z, l’argument est défini à un multiple de 2x près, 
pour z = 0 l'argument n’est pas défini. Composant un produit de 
deux nombres complexes 
z =r(cosp—+isinp), v = p (cos w + à sin +), 
on trouve 
zv = rp (cos p + à sin p) (cos ÿ + à sin ÿ) = 
= rp (cos (p + ÿ) + à sin (p + Ÿ)). 
On en déduit que 
z" = r” (cos np + i sin ny). 

. Cette égalité s'appelle formule de Moivre. Elle permet de calculer 
aisément les racines de l’équation (68.1). En effet, soit un nombre 
complexe a mis sous la forme trigonométrique 

a = «& (cos 8 + i sin 0). 
L'équation : 
a—7 =0 
par rapport à z est équivalente à l’équation 

@ (cos 0 + i sin 0) = r” (cos np + i sin ny) 

par rapport à r et à o. Or, cette dernière équation possède les solu- 
tions immédiates 

r = + a, q= 


pour 4 = 0, 1, 2, ..., nr — 1. Par conséquent, les nombres com- 
plexes 


ap = +3 a (cos SEE + isin HE | (68.2) 
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sont les racines de l’équation (68.1). Nous dirons pour ces nombres 
racines n-ièmes du nombre a et introduirons une notation commune 


a=ÿy à. 


* Soit à présent f (z) un polynôme arbitraire à coefficients com- 
plexes. Considérons-le comme une fonction complexe de la variable 
complexe z. Pour de telles fonctions, de même que pour des fonctions 
réelles d’une variable réelle, on peut faire intervenir des notions de 
continuité, de dérivée, etc. Nous n’aurons pas besoin de toutes ces 
notions dans la même mesure, mais elles sont toutes fondées sur 
le fait que l’espace des nombres complexes est complet. 

On dit qu’une fonction complexe univoque f (z) de la variable 
complexe z est continue en un point z, si pour tout nombre e —0 
aussi petit que l’on veut on peut trouver un ô =—0 tel que pour 
tout nombre complexe z vérifiant l'inégalité 


[Z — 2 | < 6, 


on ait 
LF (z) — f (Go) | <e. 


La fonction f (z) continue en chaque point du domaine de définition 
est dite partout continue ou simplement continue. 
Lemme 68.1. Un polynôme f (z) à coefficients complexes est 
une fonction continue de la variable complexe z. 
Démonstration. Soient 


f)=a4@+az+...+a,z (68.3) 


et z, un nombre complexe arbitraire. Notons k = z — z,. Montrons 
que pour tout nombre e =—0 aussi petit que l'on veut on peut 
trouver un ô 0 tel que pour | k | 6 soit respectée l'inégalité 
| f (2) — f (0) 1 <e. 

En développant le polynôme donné f (z) suivant les puissances 
de (z — z), on obtient 


f (2) = 40 + A1 (2 — 20) + - +. + An (2 — 20)". 
Puisque À, = f (z) et que (z — z,) est noté h, il vient 
f (Go + À) — f (co) = Ah +... + Ah. (68.4) 
Il s'ensuit que 
Lf (zo + k) — f (20) I < TA 1lR +... 
+ TA llRF = ART. (68.5) 


La fonction réelle À (| |) est un polynôme à coefficients réels 
par rapport à la variable réelle | À |. Comme on le sait de l'analyse, 
A (| |) est une fonction partout continue et, en particulier, pour 


15—01090 
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[k | — 0. Etant donné que À (0) = 0, d’après 8 = 0 donné on peut 
trouver un ô =—0 tel que pour 


[hk | << 8 (68.6) 
on ait 
A (IR D) <e. 


En tenant compte de l'inégalité (68.5), on constate que (68.6) impli- 
que l’inégalite 
1 f (Zo + À) — f (zo) 1 << €. 


Corollaire. Le module d'un polynôme est une fonction 
continue. 
Cette proposition est immédiate d'après la relation suivante 


[TF() 1— 17 (Go) 11 < 17 () —  (o) |. 


Corollaire. Siune suite des nombres complexes {z,} converge 
vers Zo, alors, pour tout polynôme f (z), on a 


lim f (24) = f (20)- 
Lemme 68.2. Si un polynôme f (z) de degré n > 1 ne s'annule 
pas pour z = 29, On peut toujours trouver un nombre complexe h tel que 


| f (o + À) | << 1 f (20) |. 


Démonstration. Considérons encore le développement 
(68.4). Soit À, le premier coefficient non nul parmi les coefficients 
A;, A3, ..., An. Prenons 


À 
f (20) 

h=t y -, (68.7) 

où comme racine k-ième on choisit l’une quelconque de ses valeurs, et 

O<t< f. (68.8) 


Désignons 


hf F{z) \P 
B,=Ap(V —1% }. 
À présent, compte tenu de (68.7), (68.8), on tire de (68.4) 
f (20 + R)|=1f (20) — 2 f (20) + Bass +... HE Ba |< 
L|(L—E) F (20) + ET Bal +... + PIB, |= 
= (1—2")]| (20) +] Bausl+ ... +81 B,|= 
=|f(2)1 +2 (—1f (20)1+ 11 Bas] +... 
ee HET Ba l)=]f(20)|+ t*B (6). 
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On a finalement 
[fGo+h)1<17f(2) | + ÀB (+). 


La fonction B (t) est un polynôme à coefficients réels de la varia- 
ble réelle £. C’est une fonction continue. Mais B (0) = — | f (2) | < 
< 0, B (t) étant continue, il s'ensuit qu'il existe dans les limites 
0 << ty < un, tel que B (t,) soit également négatif. Pour le nombre 
complexe » défini par (68.7) avec t?, ainsi choisi, on obtient 


(zh) 11 / (20) 1 + #08 (to) <1f (20): 


Lemme 68.3. Tout polynôme f (z) de degrén > 1 et toute suite 
infinie {z,} des nombres complexes vérifient la relation limite 


lim [7 (a) [= + oo. (68.9) 


Démonstration. Considérons le polynôme (68.3). Pour 
tout zÆ0, on a 


A1>te lat (1 — | 


La suite {z,} étant infiniment grande, 


F7 —— 


4 | 21). (68.10) 


A + co. 


Le second membre de la relation (68.10) est une fonction réelle; 
donc, on calcule 


[28 PT — 


. a 
lim (1— | 2e 
ie ( An 


ca EU ie 
Or, pour l’autre facteur de (68.10), on a 


lim |a;, ||z "= + co. 
11-00 
Par suite, la relation (68.9) est vraie. 

Théorème 68.1 (théorème fondamental de l'algèbre). Tout 
polynôme f (z) de degré n > 1 à coefficients complexes possède au moins 
une racine qui, dans le cas ïs général, est un nombre complexe. 

Démonstration. Considérons l’ensemble de toutes les 
valeurs du module du polynôme (2). Puisque |f(z) | 0, cet 
ensemble est borné inférieurement. On sait de l'analyse que tout 
ensemble non vide des nombres réels borné inférieurement possède 
une borne inférieure exacte. Supposons que pour l’ensemble des 
valeurs de |f(z) | elle soit Z. Cela signifie que pour tout nombre 
naturel Æ il existe un nombre complexe z, tel que 


OL (2) —1<T*. 
45* 
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Il en résulte que 
lim|f(z)|= 21. (68.11) 
k— 00 


Si l'on suppose que la suite {z,} soit non bornée, on pourrait en 
tirer une sous-suite infiniment grande et, d'après le lemme 68.3, 
la relation (68.11) ne pourrait pas être respectée. La suite {z,} est 
donc bornée. Extrayons-en une sous-suite convergente {zx} et soit 

lim 2x, = 2. 
k,,—co 

D'après le corollaire du lemme 68.1, le module d'un polynôme 
est une fonction continue. Par conséquent, 


LFG)I= Jim If) 1= EL 


Si LÆ0, le lemme 68.2 implique qu'il existe un nombre z, tel 
que |/(z) | << L. Ceci contredit le fait que L est la borne inférieure 


exacte des valeurs du module du polynôme, et donc, ! = 0. 
Ainsi nous avons démontré l'existence d’un nombre complexe 
tel que | (20) | = 0, ou, ce qui revient au même, que 
Î (Go) — 0. 


Cela signifie que z, est une racine du polynôme f (2). 


Exercices 


1. Montrer que l'ensemble de toutes]les racines n-ièmes du nombre com- 
plexe 1 engendre un groupe commutatif par rapport à la multiplication. 

2. Montrer que pour qu'une suite de nombres complexes {z,} soit bornée, 
il faut et il suffit que la suite {/ (z.)} soit bornée au moins pour un polynôme 
f(z) de degré nr > 1. 

3. Prouver que pour tout polynôme f (z) de degré »r > 1 et pour tout nombre 
complexe :o il existe un nombre complexe k tel que | f (20 + h)| > 1 f (20) |. 
: 4. Montrer que toutes les racines du polynôme (68.3) sont contenues dans 

‘anneau 


5. Essayer de « démontrer » que le corps des nombres réels est algébrique- 
ment clos en suivant le même principe que pour les nombres complexes. En quel 
endroit de la « démonstration » l’analogie disparaît? 


ak 
an 


a 


a 


(1 + max 


—1 
] <121K (14 max 
R>0 R<n 


$S 69. Conséquences du théorème fondamental 


Le théorème fondamental entraîne plusieurs conséquences. Exa- 
minons les plus importantes d'entre elles. 

Un polynôme } (z) de degré n => 1 à coefficients complexes possède 
au moins une racine Z,. Il s'ensuit que f (z) admet le développement 


f(G) =(—-2)9(), 
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où w (z) est un polynôme de degré nr — 1. Les coefficients du poly- 
nôme œ (z) sont encore des nombres complexes. Par conséquent, 
o (z) possède une racine z, (si nr > 2) et l’on a 


p (2) = (2 — 22) Ÿ (2), 
ce qui implique que 
f (2) = (2 — 21) (2 — 22) Ÿ (2). 


En poursuivant de même on aboutit au développement d’un pol ynü- 
me en produit de facteurs du premier degré 


fG)=bG—-2)(—2:)...(G— 2), 


où b est un nombre. En effectuant les opérations du second membre 
du développement obtenu et en comparant les coefficients affectés 
aux termes à coefficients a; du polynôme /(z), on constate que 
b = a... 

Parmi les nombres z;, Z:, ..., z, il peut y avoir des nombres 
égaux. Supposons pour simplifier que Z,, ..., z, soient distincts 
deux à deux et que chacun des nombres z,:,, - .., z, soit égal à l’un 
des premiers nombres. Le polynôme / (z) peut alors s’écrire 


f(z)=a,(2—2)"1(2—2)#2...(2—2,)"7, (69.1) 
où 2-22; pour i-jet 
kithko+t...Lk,=n. 


Le développement (69.1) s'appelle /actorisation canonique du poly- 
nôme f (z). 

Pour le polynôme /(z) la factorisation canonique est unique 
à l’ordre des facteurs près. En effet, supposons qu'en plus de (69.1) 
il existe une autre factorisation canonique 


f(z)=an(z2— 0) (2— 0) ...(2—vm)m. 
Alors, on vérifie l'égalité 
(2— 2) (2—20)le ... (2 —_2)°r — 


= (z2—v)M(z— uv) ...(2—vm)m. (69.2) 


Remarquons que la collection de nombres z,, ..., z, doit coïnci- 
der avec celle de nombres w,, ..., un. Si, par exemple, z, n’est 
égal à aucun des nombres v,, . .., v,, en portant z = z, dans (69.2) 


on obtient dans le premier membre un zéro et dans le second membre, 
un nombre différent de zéro. Ainsi, si le polynôme j (z) possède deux 
factorisations canoniques, l'égalité (69.2) ne peut être autre que 


(z— 2) (2— 2)... (2—2,) = (2— 2) (z2— 2)... (2—2)fr. 
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Supposons, par exemple, que 4, = 2, et soit, pour fixer les idées, 
k1 > l,. En divisant le premier et le second membres de la dernière 
égalité par le même diviseur (z — z,), on obtient 


(22) (z— 2). (2—a re (cz) (22). 


En portant ici encore z = z,, on établit que le premier membre 
s'annule et que le second membre est un nombre différent de zéro. 
Ainsi, on a démontré l’unicité de la factorisation canonique. 

Si, dans la factorisation canonique (69.1), on a 4; — 1, la racine 
z, est dite simple ; maïs si k; > 1, la racine z, est multiple. Le nombre 
k, se nomme multiplicité de la racine z;. A présent, nous pouvons 
formuler une conclusion importante. 

Tout polynôme de degré n > À à coefficients complexes possède n 
racines si l'on compte k;, fois chaque racine de multiplicité k;. 

Un polynôme de degré nul ne possède pas de racines. Le seul 
polynôme qui a autant de racines distinctes deux à deux que l'on 
veut est le polynôme nul. Ces faits peuvent être mis à profit pour 
en tirer la conclusion suivante: 

Si deux polynômes f (z) et g (z) de degré n au plus prennent des 
valeurs identiques pour plus de n valeurs distinctes de l'argument, tous 
les coefficients correspondants de ces polynômes sont égaux entre eux. 

En effet, en vertu de notre hypothèse, le polynôme f (z) — g (z) 
possède plus de rx racines. Or, son degré étant z au plus, il s'ensuit 
que f(z) —g(z) = 0. 

Ainsi, un polynôme / (z) de degré 7 au plus est défini complète- 
ment par ses valeurs pour n'importe quelles rz + 1 valeurs distinctes 
de la variable. Ceci permet de reconstituer le polynôme d'après ses 
valeurs. Il n'est pas difficile d'indiquer une forme explicite de ce 
polynôme « reconstitué ». Si pour les valeurs de l’argument u;, ... 


.. Œn+1 le polynôme / (z) prend les valeurs f (a), . . ., f (&n+1), 
il vient 
S (e— a) …( ) (2 en) + ( 
= à RE 2 LS ot 2 VER 2 LES 
f (z) = ÿ, Î (œi) (&œ; — 4) 2e (Gi —@;-1) (Gi; —G;,s) (Hi —Un+1) 


1=1 


Il est clair que le degré du polynôme du second membre est n au 
plus et qu'aux points z = a; il prend les valeurs f (a;). Un polynôme 
ainsi construit s'appelle polynôme d'interpolation de Lagrange. 

Considérons maintenant un polynôme } (z) de degré n et soienl 
Zi» Z2y + +: Zn SeS racines prises dans leur ordre de multiplicité. 
Il vient 


f(z) = an (2 — 2) ( —2:)...( — 2). 


En multipliant les expressions entre parenthèses du second membre, 
en réduisant les termes semblables et en comparant les coefficients 
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obtenus aux coefficients de (68.3), nous déduisons les égalités sui- 
vantes : 


An-1/0n = — (+224... +5), 
An-2/0n = + (2122 À 2423 + ee + Zn +... + Zn-12n); 
Zn-3/Qn son (212223 + 212224 SD un Zn-2%n-12n); 
aylan = (— 1)" 1 (2422 0. Sn 4 +. 45023... En), 
Gylan =(— 1)" 2322 ... 2h. 


Ces égalités appelées formules de Viète expriment les coefficients d’un 
polynôme en fonction de ses racines. 

Le second membre de la k-ième égalité est la somme de tous les 
produits possibles de k racines, affectée du signe « plus » ou « moins » 
selon À pair ou impair. 

Dans ce qui suit, certaines conséquences du théorème fondamental 
de l’algèbre relatives aux polynômes à coefficients réels nous seront 
utiles. Soit 


f(2) =a +az+...+a,z 


le polynôme à coefficients réels et à racine complexe (mais non 
réelle!) v, c’est-à-dire 


ao +aw +... —+av" = 0. 


Cette dernière égalité n'est pas compromise si tous les nombres 
y sont remplacés par leurs complexes conjugués. Toutefois, cette 
substitution ne change pas les coefficients a,, . .., a, et le nombre O, 
qui sont des nombres réels. Donc 


ay + av +- ...+av"—=0, 


c'est-à-dire f (v) := 0. 

De cette façon, si un nombre complexe (mais non réel!) v est 
une racine du polynôme j (z) à coefficients réels, le nombre complexe 
conjugué v sera également une racine de } (z). 

Il s'ensuit que le polynôme }j (2) se divise par le trinôme du 
second degré à coefficients réels 


p(z)=(2—v)(2—0v)=22— (04 v):+ uv. 
En utilisant ce fait, montrons que la multiplicité des racines v et v 
est la meme. 
Supposons que leurs multiplicités soient À et Z et, par exemple, 


que À > L. Alors, (2) se divise par la l-ième puissance du polynôme 
œ (2), c'est-à-dire 


f (2) = g' (2)-a (2). 
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Le polynôme q (z), en tant que quotient de deux polynômes à coeffi- 
cients réels, possède également des coefficients réels. Par hypothèse, 
le nombre v doit être sa racine (k — /)-tuple et il ne doit pas posséder 


de racine égale à v. D'après ce qui a été prouvé plus haut, ceci est 
impossible, donc k = /. Ainsi, toutes les racines complexes d’un 
polynôme quelconque à coefficients réels sont complexes conjuguées 
deux à deux. L'unicité de la factorisation canonique entraîne la 
conclusion suivante. 

Tout polynôme à coefficients réels peut être mis de façon unique, 
à l’ordre des facteurs près, sous la forme du produit de son coeffi- 
cient dominant par les polynômes à coefficients réels. Les coefficients 
dominants de ces polynômes valent 1 ; les polynômes sont du premier 
degré s'ils correspondent à des racines réelles, et du second s'ils 
correspondent à des couples de racines complexes conjuguées. 

Enfin, voici la conclusion la plus importante, pour laquelle 
a été démontré le théorème fondamental de l’algèbre. Soit À un opéra- 
teur linéaire dans un espace complexe. Son polynôme caractéristique 
a pour racines les valeurs propres de cet opérateur et elles seules. 
D'après le théorème fondamental, l'opérateur À possède une valeur 
propre À au moins. Par conséquent, 

Dans un espace vectoriel complexe tout opérateur linéaire possède 
au moins un vecteur propre. 

Constatons que, pour un opérateur À dans un espace réel ou ra- 
tionnel, cette conclusion n'est plus valable. 

Pour les valeurs propres nous emploierons la même terminologie 
que pour les racines d’un polynôme. En particulier, nous dirons 
qu'une valeur propre est simple si elle est une racine simple du poly- 
nôme caractéristique, et multiple dans le cas contraire. Nous appe- 
Jons multiplicité d’une valeur propre À sa multiplicité en tant que 
racine du polynôme caractéristique. 


Exercices 


1. Montrer que si un nombre complexe a 0, alors pour tout nombre 
naturel n il existe seulement n nombres complexes différents dont la n»-ième 
puissance est égale à a. 

2. Comment sont liées entre elles les racines de deux polynômes f (:) et 
f(z: — a) où a est un nombre complexe? 

3. Soit f (z) un polynôme de degré »# au plus et à coefficients complexes qui 
prend les mêmes valeurs pour n + 1 valeurs distinctes de la variable. Prouver 
que f(:) est un polynôme de degré nul. 

4. Montrer que tout polynôme de degré impair à coefficients réels possède 
au moins une racine réelle. 

5. Montrer qu'un polynôme f (:) possède au moins une racine dans chacun 


des deux domaines 
n EPS ñn 4. =. 1 
; ao ao 
1e VTT, 1a> let 
| | < a , | 1> an 
6. Prouver qu'un opérateur À possède une structure simple si et seulement 


si le nombre de vecteurs propres linéairement indépendants associés à chaque 
valeur propre est égal à la multiplicité À de cette dernière. 


CHAPITRE 9 
STRUCTURE D'UN OPÉRATEUR LINÉAIRE 


$ 70. Sous-espaces invariants 


Les études que nous abordons seront poursuivies dans l'hypothèse 
qu'un opérateur linéaire est donné dans un espace complexe X. Com- 
me nous l’avons noté, cette hypothèse assure l'existence pour chaque 
opérateur linéaire au moins d’un vecteur propre. 

Un sous-espace ZL d’un espace vectoriel X est appelé sous-espace 
invariant par rapport à l’opérateur À si pour tout vecteur x de L 
son image Az appartient également à L. 

Tout opérateur linéaire possède au moins deux sous-espaces 
invariants triviaur, le sous-espace nul et l’espace X tout entier. 
Seuls les sous-espaces r0n triviaux présentent un intérêt réel. Tels 
sont, par exemple, les sous-espaces propres. Etant donné que dans 
un espace vectoriel complexe tout opérateur possède au moins un 
vecteur propre, cet opérateur possède nécessairement au moins un 
sous-espace invariant non trivial. 

On vérifie aisément que le domaine des valeurs 7, et le noyau N, 
de tout opérateur À sont des sous-espaces invariants. Ces sous-es- 
paces sont triviaux si et seulement si l'opérateur À est non dégénéré 
ou nul. 

Si L est un sous-espace invariant, il existe de nombreux moyens 


pour construire un sous-espace supplémentaire M tel que X = ZL + 


+ M.'Toutefois, parmi de tels sous-espaces supplémentaires i/ peut 
n'y avoir aucun sous-espace invariant. Mais s’il existe au moins un 
sous-espace invariant supplémentaire, on peut parler de la décompo- 
sition de l’espace en une somme directe de sous-espaces invariants. 

La connaissance d’un sous-espace invariant et, d'autant plus, 
d'une décomposition de l'espace en une somme directe de sous- 
espaces invariants, rend possible la construction d’une base dans 
laquelle la forme de la matrice de l'opérateur est plus simple. Suppo- 
sons qu’un opérateur À possède dans un espace À de dimension m 
un sous-espace invariant ZL de dimension 7. Choisissons une base 
js Ces + + +5 Em dans À telle que ses premiers r vecteurs appartien- 
nent à L. Alors, les images Ae,, ..., Ae, des vecteurs e,, ...,e, 
appartiendront à L et on pourrait les décomposer suivant les vec- 
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teurs €, . . ., €, en tant que vecteurs de la base L. Par conséquent, 


A6; = Qj6; + Q2362 + ... Hansen, 


Ae; — Ainei + 5h - .… + Annêne 


Rappelons que les éléments des colonnes de la matrice d'un opéra- 
teur coiïncident avec les coordonnées des images des vecteurs de base. 
C'est pourquoi la matrice À, de l'opérateur À dans la base e,, €, ... 
+ + + Em St de la forme 


{4 + Ain : @y, nt im 
Ans -- * Ann An. n+i no Anm 
D Rod : 
0 . OGnis,nei ++. nt, m 
Uo 0 :a» n+i se Am 
Il est d'usage de noter les matrices de ce type sous une forme parti- 
lionnée : 
À, Aie 
A ; 70.1 
= (5 43) Ge 


[ci À,, est une matrice carrée z, ÀA., une matrice carrée m — ñ, 
O la matrice nulle (m—n) X n, A,, une matrice r X (m— n). 

Supposons maintenant que l'espace X se décompose en somme 
directe de deux sous-espaces invariants L et M. Choisissons une 
base e,, €», . . ., Em dans À telle que ses premiers n vecteurs appar- 
tiennent à L, et ses autres m — n vecteurs appartiennent à M. Dans 
ce cas les images 4e,, . .., Ae, ne peuvent être décomposées que 
suivant les vecteurs e,, ..., e,, et les images 4e,+:1, . .., 4e, 
suivant les vecteurs e,+1, : - ., em. La matrice À,, de (70.1) est, 
évidemment, nulle. Il s'ensuit que la matrice À. de l’opérateur À 
dans la base considérée est d’une forme encore plus simple, et plus 
précisément, 


Supposons qu’on étudie comment l'opérateur À intervient sur 
les seuls vecteurs du sous-espace invariant L. Si x € L, alors Az € L. 
Pour cette raison, on peut dire que l'opérateur À engendre sur L 
nn autre opérateur À | L défini par l'égalité 


(A |L) x = Az 
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pour tout z € L. À | L s'appelle alors opérateur induit par l’opéra- 
teur À. Par rapport à À | L l'opérateur À est appelé opérateur géné- 
rateur. En vertu de la linéarité de l'opérateur À, l'opérateur induit 
est également linéaire. L'opérateur induit À | L coïncide avec l’opé- 
rateur générateur À sur le sous-espace invariant L et n'est pas défini 
en dehors de L. Ainsi, ces opérateurs ne se distinguent en fait que 
par leurs domaines de définition. 

Malgré le caractère apparemment artificiel de l'introduction d’un 
opérateur induit, il constitue un appareil auxiliaire très commode 
pour des recherches de toutes sortes. Par exemple, un opérateur 
induit, de même que tout autre opérateur linéaire, possède au moins 
un vecteur propre. Mais comme il coïncide dans son domaine de 
définition avec l'opérateur générateur, cela signifie que 

Tout opérateur linéaire possède au moins un vecteur propre dans 
chaque sous-espace invariant. 

Si un espace est décomposé en une somme directe de r sous-espaces 
invariants, l'opérateur linéaire possède au moins r vecteurs propres 
linéairement indépendants. 

Il est clair que toute valeur propre et tout vecteur propre d'un 
opérateur induit constituent respectivement une valeur propre et 
un vecteur propre de l’opérateur générateur. L'évidence est moins 
marquée pour le 

Théorème 70.1. Le polynôme caractéristique d'un opérateur 
induit engendré sur un sous-espace non trivial est un diviseur du poly- 
nôme caractéristique de l'opérateur générateur. 

Démonstration. Soit À | L un opérateur induit sur un 
sous-espace invariant L. Choisissons une base e,, . .., e, de l’espace 
X telle que les vecteurs e,, . .., e, constituent une base dans L. 
Si la matrice de l'opérateur générateur est 4. de (70.1), la matrice 
de l'opérateur induit À | L est A, de (70.1). Le polynôme caracté- 
ristique de l'opérateur À est det (LE — À,), et de l'opérateur À | L 
det (ÀE — À,,). En appliquant le théorème de Laplace on décompose 
le déterminant det (ÀE — À.) suivant les premières r colonnes et 
on trouve 

4 d AE — À;; — A2 | 
det (AE — À.) — et | ‘ E_ 4.1 


— det (ÀE — À,,) det (AE — 4,2). 

L'égalité obtenue démontre le théorème. 

Le calcul de toutes les valeurs propres d’un opérateur À se ramène 
à la recherche de toutes les racines du polynôme caractéristique. 
Si l'opérateur À possède un sous-espace invariant non trivial, alors, 
d’après le théorème (70.1), ce problème peut être réduit à la recherche 
de toutes les racines de deux polynômes de plus petits degrés. Si 
l'opérateur induit lui-même possède un sous-espace invariant, la 
factorisation du polynôme caractéristique peut être poursuivie. 
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Exercices 


1. Montrer que la somme et l'intersection des sous-espaces invariants sont 
des sous-espaces invariants. 

2. Montrer que si un opérateur À est non dégénéré, tout opérateur induit 
est également non dégénéré. 

3. Montrer que si un opérateur À est de structure simple, tout opérateur 
induit est également de structure simple. 

4. Dans quel cas un sous-espace invariant d'un opérateur de structure 
simple est une somme directe de sous-espaces propres? 

5. Prouver que si au moins un sous-espace invariant d'un opérateur À ne 
possède pas de sous-espace invariant supplémentaire, À ne peut être de struc- 
ture simple. 

6. Montrer que si un opérateur À est de structure simple, son domainc 
des valeurs cet son noyau ne possèdent pas de vecteurs communs non nuls. 

7. Prouver que si un sous-espace est invariant par rapport à un npéra- 
teur 4, il est également invariant par rapport à l'opérateur ao£ + a, A + ... 


... +a,4?. 


$ 71. Polynôme opératoriel 


L'une des méthodes les plus importantes de la construction des 
sous-espaces invariants d’un opérateur linéaire est l’utilisation des 
polynômes à coefficients complexes. 

Soit À un opérateur linéaire dans un espace complexe X. Prenons 
un polynôme quelconque 


p(z) = ao +az +... + ap 
à coefficients complexes et considérons l'opérateur linéaire 
p (4) = a£ + a1AÀ +... + a AP. 


C’est un opérateur dans l’espace X qui s'appelle polynôme opératoriel 
ou polynôme fonction de l'opérateur À. 

Fixons un opérateur À et construisons l’ensemble de tous les 
polynômes opératoriels fonctions de A. L'ensemble de tous les 
polynômes étant un anneau commutatif, l’ensemble des polynômes 
opératoriels l’est aussi. Îl en résulte, en particulier, que 


p (4) À = A4 (4) 


pour tout polynôme œ (z). La commutativité de l'anneau des polynô- 
mes opératoriels joue un rôle exceptionnel dans tout l'exposé qui suit. 

On montre facilement que le domaine des valeurs 7, de tout 
polynôme opératoriel @ (A) est un sous-espace invariant de l’opé- 
rateur À. En effet, soit z € 7,. En vertu de la permutabilité des 
opérateurs À et (À), on a 


Az = A (4) y = (4) (Ay). 


Par conséquent, le vecteur Az est l’image par l'opérateur œ (4) 
du vecteur Ay € X, c'est-à-dire Az € Ty. 
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Le noyau W, du polynôme opératoriel @ (À) est également un 
sous-espace invariant de l’opérateur À. Six € N,, alors @ (4) x = 0 
et 


p (4) (Az) = À (p (4) x) = À (0) = 0. 


Nous avons déjà noté que tout sous-espace invariant contient 
au moins un vecteur propre de l’opérateur. Maintenant nous pouvons 
énoncer une proposition plus exacte: 

Si une valeur propre d'un opérateur À est (n'est pas) racine du 
polynôme œ (z), tous les vecteurs propres de l'opérateur À associés 
à cette valeur propre appartiennent au noyau (domaine des valeurs) 
de l'opérateur œ (À). 

En effet, soit zx un vecteur propre de l'opérateur À associé à une 
valeur propre À. Dans les exercices du $ 65 on a souligné que le 
vecteur x est aussi un vecteur propre de l’opérateur (À) qui cor- 
respond à la valeur propre w (À). Par conséquent, (À) x = œ (À) z. 
Si À est une racine du polynôme ® (2), alors @ (À) = O0 et le vecteur x 
appartient au noyau de l'opérateur œ (4). Mais si @ (à) 0, le 
vecteur @ (À) x est non nul et le vecteur x appartient au domaine 
des valeurs de l'opérateur œ (À). 

Nous ne pouvons pas prouver que tout sous-espace invariant 
de l'opérateur À est ou bien le domaine des valeurs, ou bien le 
noyau d’un polynôme opératoriel. Cette proposition n'est pas vraie 
en général, ce dont témoigne l’exemple de l'opérateur identique. 
Pour tout polynôme œ (z) on a @(ÆE) = p (1) E; c'est pourquoi 
l'opérateur p (E) est soit nul, soit non dégénéré. Donc, le domaine 
des valeurs et le noyau de œ (Æ) forment toujours des sous-espaces 
triviaux. Quant au sous-espace invariant de l’opérateur E, il est 
constitué par n'importe quel sous-espace. Néanmoins, entre tout 
sous-espace invariant de l'opérateur À d’une part et des polynômes 
opératoriels de À d'autre part, il existe certaines relations. On véri- 
fie le 

Théorème 71.1. Soit L un sous-espace invariant quelconque 
d'un opérateur À. Si toutes les valeurs propres de l'opérateur induit 
sur L sont des racines du Polynôme p (z), L est alors contenu dans les 
noyaux des opérateurs q" (A) pour tous les degrés k entiers positifs 
suffisamment grands. 

Démonstration. Désignons par Ti, T;, . . . les domaines 
des valeurs des opérateurs induits sur L à l’aide des polynômes 
opératoriels p* (À) pour 4 = 1, 2, . L'opérateur (À) est dégé- 
néré sur Z du fait que son noyau contient au moins tous les vecteurs 
propres de l'opérateur À appartenant à L. Il s'ensuit que T, € Z, 
dim 7, << dim Z. Le sous-espace T, est invariant par rapport à À. 
Si T, "est non nul, alors, d’après ‘le théorème 70.1, le polynôme 
caractéristique de l'opérateur induit sur 7, à l'aide de À est un 
diviseur du polynôme caractéristique de l'opérateur induit sur Z 
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à l’aide de À. Il en résulte que toutes les valeurs propres de l’opéra- 
teur induit sur 7, sont également des racines du polynôme (2). 
Mais ceci implique encore que 7, € T;, dim 7, << dim 7, etc. 
La décroissance des dimensions des sous-espaces 7}, T,, ... ne 
peut être illimitée. Aussi, à partir d’un certain numéro k, ces sous- 
espaces resteront nuls, ce qui justifie le théorème. 

La discussion ci-dessus permet d'établir un fait important relatif 
à l'existence des sous-espaces invariants non triviaux. 

Théorème 71.2. Tout opérateur linéaire À dans un espace 
complexe X de dimension m possède au moins un sous-espace invariant 
de dimension m — 1. 

Démonstration. L'opérateur À possède au moins un 
vecteur propre r. Îl correspond à une valeur propre À. D’après ce 
qu'on a démontré, le domaine des valeurs T, de l’opérateur À — AE 
est un sous-espace invariant de l'opérateur À. Or, l'opérateur 4 — ÀE 
étant dégénéré, la dimension du sous-espace 7, est m — 1 au plus. 

Considérons maintenant un sous-espace quelconque Z de dimen- 
sion m — 1 qui contient complètement le sous-espace T;. Tout 
vecteur de l’espace X est transformé par l'opérateur À — ÀE en un 
vecteur de 7’;. C'est pourquoi Z est un sous-espace invariant par 
rapport à À — ÀE et, évidemment, par rapport à À. Le théorème 
est démontré. 


Exercices 


4. Soit À l'opérateur de dérivation dans l’espace réel de dimension finie 
des polynômes. L'opérateur (4) que représente-t-il pour un polynôme «œ (2) 
à coefficients réels? 

2. Soit  (z) le polynôme caractéristique de l'opérateur induit par un opéra- 
teur À sur un sous-espace invariant N. Prouver que N appartient au noyau de 
l'opérateur qÀ (4) pour un certain k entier positif. 

3. Montrer que si toutes les valeurs propres d’un opérateur À sont des 
racines d’un polynôme o (:), alors œqÀ (4) — O0 pour un k entier positif. 

4. Montrer que l'anneau des polynômes opératoriels engendrés par un 
opérateur quelconque possède des diviseurs de zéro. 

5. Prouver que si un opérateur À est de structure simple, l'opérateur 
(4) l’est également. La réciproque est-elle vraie? 


$ 72. Forme triangulaire 


Maintenant nous sommes en mesure de résoudre le problème 
qui consiste à réduire la matrice d’un opérateur à l’une des plus 
simples formes dite triangulaire. 

Théorème 72.1. Pour tout opérateur linéaire À dans un 
espace X de dimension m il existe des sous-espaces invariants L, de 
dimension p, p = 0, 1, ..., m— 1, m tels que 


Lee se LR<eL;: 
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Démonstration. L'existence des sous-espaces L, et Lh 
est évidente. D'après ce qui a été démontré précédemment, l’ope- 
rateur À possède un sous-espace invariant L,,-, de dimension m — 1. 

Considérons sur le sous-espace L,_\, un opérateur induit. De 
mème que tout autre opérateur donné sur L,,-_,, il possède un sous- 
espace invariant L,_-. de dimension m — 2. Mais un sous-espace 
invariant de l'opérateur induit sera également invariant pour l’opé- 
rateur générateur À. Ainsi, l’existence d'un sous-espace L,,. est 
démontrée. Si l’on examine l'opérateur induit sur le sous-espace 
Ln-», On prouve d'une façon analogue l’existence d’un sous-espace 
L,:4, ‘etc. 

Ce théorème présente surtout de l'intérêt par son interprétation 
matricielle. Construisons une base e,, e:, ..., em de l’espace X 
en utilisant les sous-espaces invariants ZL,. Choisissons comme 
vecteur e, un vecteur non nul quelconque de Z,, comme vecteur €; 
un vecteur non nul de L, n’appartenant pas à L, et, en général, 
comme vecteur e, un vecteur non nul quelconque de L, n'appar- 
tenant pas à L,_,. Considérons la matrice 4, de l'opérateur À dans 
cette base. Puisque e; appartient à L;, alors que L; est invariant 
par rapport à À, le vecteur 4e; doit être une combinaison linéaire 


de seuls vecteurs e,, e., . . ., e;. Cela veut dire que dans la décom- 
position 


Aej=— Qijes + 2502 + +: + Amjêm 


le coefficient affecté à e; doit être nul pour tout i => j. Par conséquent, 
la matrice de l'opérateur À est de la forme: 


Aiy Ayo ee + Ai, m-1 Zim 


U  @z2...@2,m-1  G2m 


À: — RS AE MO Se LAN ’ 
0 0 .. AIm-1, m-! Am-1, m 
Q 0 ...0 Amm 


où a; = 0 pour i > j. 

La matrice dont tous les éléments au-dessous (resp. au-dessus) 
de la diagonale principale sont nuls s'appelle matrice triangulaire 
inférieure (resp. supérieure). Dans le langage matriciel le résultat 
obtenu signifie que toute matrice carrée est semblable à une matrice 
triangulaire supérieure. 

La forme triangulaire de matrice s'emploie largement pour 
démontrer les faits les plus divers relatifs aux opérateurs linéaires. 
Ceci s'explique surtout par la propriété suivante. 

Si un opérateur À possède dans une certaine base une matrice 
triangulaire À4,, les éléments diagonaux de la matrice À, coïncident 


avec les valeurs propres de l’opérateur À, même si l’on tient compte 
de la multiplicité de ces dernières. 
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En effet, en utilisant le théorème de Laplace, on trouve que le 
polynôme caractéristique de la matrice À, est égal à 


det (ÀE — 4.) — Îl (À — ii), 


d’où notre proposition. 

Üne partie importante de la théorie ultérieure des opérateurs 
linéaires a pour objet le perfectionnement du résultat obtenu sur 
la réduction de la matrice d'un opérateur à la forme triangulaire. 
La forme la plus simple possible de la matrice d’un opérateur est 
la forme diagonale. Comme nous le savons, ce ne sont que les matri- 
ces des opérateurs de structure simple qui peuvent être réduites 
à cette forme. Pourtant, la forme triangulaire n’est pas la plus simple 
non plus, même pour les opérateurs à structure non simple. 


Exercices 


1. Montrer que toute matrice carrée est aussi bien semblable à une matrice 
triangulaire inférieure. 

2. Prouver que l’ensemble des matrices triangulaires de même type et de 
mème nom forme un anneau. 

3. Montrer que l'ensemble des matrices triangulaires non dégénérées de 
même type et de même nom forme un groupe. 

4. Soient À, As, - -., Àm Iles valeurs propres d’un opérateur À écrites 
dans l'ordre de leur multiplicité. Montrer que pour tout polynôme œ (z), compte 
tenu de la multiplicité, les valeurs propres de l’opérateur q (4) sont les nom- 
bres (A), p (As), - -., (An). 

5. Montrer que si tous les éléments diagonaux d’une matrice triangulaire À 
de type m sont nuls, alors Am — 0. 

6. Soit une matrice triangulaire semblable à une matrice diagonale. Prou- 
ver que la matrice correspondante de la transformation de similitude peut être 
choisie triangulaire de même nom. 


$ 73. Somme directe des opérateurs 


Un opérateur linéaire dont toutes les valeurs propres sont égales 
entre elles est dans un certain sens exceptionnel. Nous montrerons, 
pourtant, que tout opérateur linéaire peut être composé de tels 
opérateurs. 

Soit X un espace mis sous la forme de somme directe de deux 
sous-espaces L et M. Donnons sur le sous-espace L un opérateur B, 
sur le sous-espace M un opérateur C. Tout vecteur x € X satisfait 
à la décomposition unique 

TZ = Lzr + LM) (73.1) 
où zL1CL,zmE M. 
L'opérateur À défini par l'égalité 
Az = Bzrz + Cru 
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s'appelle somme directe des opérateurs B et C. Si l’un des sous-espa- 
ces L, M est trivial, la somme directe est dite triviale elle aussi. 

On verifie sans peine que À est un opérateur linéaire dans À. 
Montrons que ce n’est que d’une seule façon qu’on peut le mettre 
sous la forme de somme directe des opérateurs définis sur les espaces 
L et M. En effet, pour tout vecteur x € L on a Az = Bz. D'une 
façon analogue, Az = Cxz pour tout x € M. Ceci traduit le fait 
que l'opérateur B coïncide avec l'opérateur induit À | Z, l’opéra- 
teur C avec À | M. 

Considérons maintenant un opérateur arbitraire À dans un 
espace X. Si X est décomposé d’une certaine façon en somme directe 
des sous-espaces L et M invariants par rapport à l'opérateur À, 
l'opérateur À lui-même peut être décomposé en somme directe. En effet, 
construisons les opérateurs induits À | ZL et À | M. Après avoir 
décomposé encore le vecteur arbitraire zx € À en une somme (73.1), 
on obtient 


Az = (A ÏL)z1 + (4 | M)zw. 


Dans ce cas, d’après le théorème 70.1, le polynôme caractéristique 
de l'opérateur À est égal au produit des polynômes caractéristiques 
des opérateurs induits À | ZL et À | M. 

La décomposition d’un opérateur À en somme directe peut se 
faire à l’aide de tout polynôme opératoriel (4). Notons W, le 
noyau de l'opérateur œ* (4). C'est un sous-espace invariant par 
rapport à À, et, évidemment, NS NC... Montrons d’abord 
que si V, — Nu pour n'importe quel k, alors N, — {V, pour tout 
p > k. En effet, soit x € N, un vecteur quelconque : alors qP (4) x = 
= (. En écrivant cette égalité sous la forme "*1 (4) (qP-À-1 (4) x) = 
— (0 nous en tirons que gp*-1(A)zE€ Nat En vertu de l'égalité 
N}, = Ny31, ce même vecteur appartient à V,. Par conséquent, 


p" (4) (pP-*-1 (4)z) = qP-1(4)z=0, 


c'est-à-dire que xE N,_. La proposition énoncée se démontre 
maintenant par récurrence sur p. 

L'espace À où agit l'opérateur À est de dimension finie ; il en 
résulte que les dimensions des sous-espaces V, ne peuvent s’accroître 
à l'infini. Soit q le plus petit entier positif tel que NV, — N o+ qa+1- 
Désignons par Th le domaine des valeurs de l'opérateur p* (4) 
et examinons n'importe quel vecteur z commun aux sous-espaces 
TaetN,. On ap? (4) zx = Oetz — (4) y pour un certain vecteur 
yEX. Ceci implique que p*1 (4) y = 0, c’est-à-dire y € M 
Or, d’après ce qui a été démontré plus haut, on vérifie l'égalité 
Na = N:94. Donc, yE N,, c'est-à-dire q* (4) y = 0. 

16—01090 
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Ainsi, les sous-espaces 7, et N, n’ont de commun que le vecteur 
nul. En vertu de la formule (56. 3) “cela signifie que À = T, + N4. 
Les sous-espaces T, et Na sont invariants; par conséquent, fa possi- 
bilite de la décomposition d’un opérateur est établie. 

Comme nous l’avons déjà noté, tous les vecteurs propres de À 
sont astreints à être contenus dans les sous-espaces T, et V,. Qui 
plus est, V, contient ceux d’entre eux qui correspondent aux valeurs 
propres coïncidant avec des racines quelconques du polynôme œ (2): 
T, ceux d’entre eux pour lesquels les valeurs propres correspondantes 
ne coincident avec aucune des racines de @ (2). Etant donné que 
chaque valeur propre est associée au moins à un vecteur propre, 
on en tire que: 

Toute racine (resp. aucune des racines) du polynôme caractéris- 
tique de l’opérateur induit sur VW, (T,) est (resp. n’est pas) racine 
du polynôme  (z). 

La caractéristique définitive de la décomposition d'un opéra- 
teur en somme directe obtenue à l’aide des polynômes opératoriels 
donne le 

Théorème 73.1. Supposons que le polynôme caractéristique 
f (z) d'un opérateur À soit décomposé en produit de deux polynômes 
œ (z) et d (2) ne possédant pas de racines communes. À lors, l'opérateur 
A peut être décomposé d'une façon unique en somme directe de 
deux opérateurs B et C dont les polynômes caractéristiques sont œ (z) 
et 1 (2). 

Démonstration. Examinons la décomposition de l’opé- 
rateur À en somme directe obtenue à l’aide du polynôme œ (z). 
‘Etant donné que le produit des polynômes caractéristiques des 
opérateurs déterminant la somme directe coïncide avec le polynôme 
caractéristique f (2), l'existence d'au moins une décomposition se 
déduit de la discussion antérieure. 

Supposons maintenant que l'espace X soit décomposé d’une 
autre façon en somme directe des sous-espaces invariants À ct 7. 
De plus, l'opérateur induit sur Ÿ a pour polynôme caractéristique 
 (z) et l'opérateur sur T le polynôme: (z). D'après le théorème 71.1, 
N € N, pour tout k# suffisamment grand, donc N € W,. L’opéra- 
teur œ (A) est un opérateur non dégénéré sur T'; par conséquent, 
l'ensemble des images par (A) des vecteurs tirés de T' coïncide 
avec T7. Mais cela signifie que T € T} pour tout #. Les sous-espa- 
ces NV, T, ainsi que W,, T,, engendrent en somme directe l’espace X. 
‘C'est pourquoi les inclusions NE N,, TET, ne peuvent avoir 
lieu que dans le cas où N = N,, T = T,. Le théorème est démontré. 

Soit À un opérateur dans l’espace X de dimension m. Mettons 
le polynôme caractéristique f (z) de l'opérateur À sous la forme de 
factorisation canonique 


f(z)=(2— M) (z— Ah... (2—2,)"7, (73.2) 
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OÙ À, À», . . ., À Sont des valeurs propres distinctes deux à deux 
et A + k, + ... + k, = m. Considérons les polynômes 


(2— A), (2— oh, ...,(2— 77. 


Ce sont des diviseurs du polynôme caractéristique f (z) et aucun 
de leurs couples ne possède de racines communes. D’après le théorè- 
me 73.1, il existe des sous-espaces invariants À,, ÀR,, ..., R, tels 
que 


X=R LR:...LR;: 


De plus, la dimension du sous-espace À; est k;, et l’opérateur 
induit sur À; a pour polynôme caractéristique (z — À;)hi. 

Le sous-espace R; s'appelle sous-espace principal de l'opérateur À, 
associé à la valeur propre À;. Les vecteurs d’un sous-espace principal 
sont appelés vecteurs principaux. Ce qui vient d'être dit entraîne 
que tout opérateur peut être décompose en somme directe des opé- 
rateurs induits sur les sous-espaces principaux. 

Le sous-espace principal À; coïncide avec le noyau de l’opéra- 
teur ((4 — À;,E)*)f pour un certain entier positif g. Montrons que 
l'on peut poser qg = 1. Examinons les opérateurs (A — À;,E)? pour 
p — 1, 2, ... Soit p; le plus petit nombre tel que le noyau de 
l'opérateur (4 — À;E)Pi coïncide avec le noyau de l'opérateur 
(A — À;E)ritl, Alors, le sous-espace principal À; coïncide avec 
le noyau de l'opérateur (À — À;E)Pi. Puisque la croissance des 
dimensions des noyaux des opérateurs (À — À,E)P pour p = 1,2, ... 
est monotone, alors que la dimension du sous-espace À; est k;, 
on a Pr; Li. 

Ainsi, le sous-espace principal À; associé à la valeur propre À; 
de multiplicité #; coïncide avec le noyau de l'opérateur (A — À,E)i. 

Théorème 73.2. (théorème de Cayley-Hamilton). Si f (z) est 
le polynôme caractéristique d'un opérateur À, alors f (A) est l'opéra- 
teur nul. 

Démonstration. NMettons le polynôme caractéristique 
sous la forme de factorisation canonique (73.2). Puisque le polynôme 
opératoriel f (A) contient le facteur (À — À,E)*t et que tous les 
polvnômes fonctions d’un même opérateur sont permutables, alors 
f (A) x; = 0 pour tout vecteur x; de R;. Fixons maintenant un 
vecteur arbitraire x et mettons-le sous la forme x = x, + x, + ... 
... +zx,, où x; € R;. Maintenant il est clair que f (4) zx = 0, 
c'est-à-dire que f (A) est l'opérateur nul. 

Là encore l'interprétation matricielle des résultats obtenus 
présente un grand intérêt. Composons une base de l’espace comme 
une réunion successive des bases quelconques des sous-espaces 
principaux ÀR;,, R:, ..., R,. Les sous-espaces principaux sont 
invariants et leur somme directe coïncide avec X. C’est pourquoi 
la matrice À, de l'opérateur À dans la base donnée sera d’une forme 


16* 
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dite quasi diagonale 
[Au 0 } 


Az2 
(73.3) 


(O Arr 
Chaque matrice À;; est d'ordre k;, elle représente une matrice de 
l'opérateur induit sur le sous-espace À:. 


Exercices 


4. Peut-on décomposer l'opérateur de dérivation donné dans un espace 
de dimension finie des polynômes en une somme directe non triviale? 

2. Montrer qu'un système de vecteurs principaux associés à des valeurs 
propres distinctes deux à deux est linéairement independant. 

3. Montrer que si un opérateur À est non dégénéré, alors, pour un poly- 
nôme  (z), on a A -1 — (4). 

4. Un opérateur À est dit nilpotent si AP — © pour un p entier positif. 
Montrer qu'un opérateur est nilpotent si et seulement si toutes ses valeurs propres 
sont nulles. 

5. Soit p(z) un polynôme de degré minimal tel que œ (4) — 0. Montrer 
que œ(z) est un diviseur du polynôme caractéristique de l'opérateur 4. 


$ 74. Forme de Jordan 


Le seul moyen de réduire la matrice d'un opérateur à une forme 
encore plus simple que la forme quasi diagonale (73.3) consiste 
à choisir des bases spéciales de chacun des sous-espaces principaux. 
Certes, les bases principales peuvent étre choisies de façon que toute 
matrice À;;, de (73.3) soit triangulaire. Pourtant, cette forme de la 
matrice d'un opérateur n'est pas encore la plus simple. 

Etudions de plus près la structure des sous-espaces principaux. 
Si x ER, alors (4 — À,E)*ix — 0. Mais pour chaque vecteur z 
concret, l'égalité (À — À;E)"x = 0 peut être aussi parfaitement 
observée avec m << k;. En particulier, si x est un vecteur propre 
associé à une valeur propre À; multiple, alors (4 — À,E) x = 0, 
bien que k; > 2. 

On appelle indice d’un vecteur principal x le plus petit entier 
non négatif m tel que (A — À,E)"x = 0. 

Les indices de tous les vecteurs principaux qui correspondent 
à une valeur propre À, ne dépassent pas la multiplicité de À;. Pour- 
tant, rappelons que, dans le cas général, les indices dés vecteurs 
principaux et les multiplicités des valeurs propres sont des notions 
différentes. Ainsi, pour un opérateur de structure simple il n'existe 
pas en général de vecteurs principaux d'un indice supérieur à l'unité, 
indépendamment de la multiplicité des valeurs propres. 
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Soit À; un sous-espace principal associé à la valeur propre À, 
de multiplicité k;. Notons ft l'indice maximal des vecteurs princi- 
paux de R;. Il est clair que t < k;. Si l’indice du vecteur x est 4, 
celui du vecteur (4 — À,E) x est À — 1. C’est pourquoi le sous-espa- 
ce R; possède des vecteurs radicaux de tous les indices, de 0 à #. 

Désignons par FH, la collection de vecteurs dont les indices ne 
dépassent pas À pour tout # 1. On montre facilement que H, 
est un sous-espace de À;. Si x, y € H,, alors (À — À;E)"xr — 
— (4 — À,E)"y = 0. Mais alors, quels que soient les nombres «, B, 
on a (À — À;E)" (ax + By) — 0, c'est-à-dire «x + By € H,. Ensui- 
te, il est évident que 


0=H CHE... .cH,,cHi=R:. 


Désignons les dimensions de ces sous-espaces par m4, O = m, << 
ML... Mn LM = ki. 

Soient f1, - - . fp, des vecteurs linéairement indépendants de X;, 
dont l’enveloppe linéaire en somme directe avec H,_, donne H.. 
Il est évident que ce sont des vecteurs principaux d'indice {, que 
P1 = Mr — Mr, et qu'aucure des combinaisons linéaires non nulles 

es vecteurs fi, . ... f,, n appartient à /;_;. Considérons la collec- 


tion de vecteurs 


fi RE fps | 
(A—DME)fn ..., (A—ME) fs | 
(A—AE} ff, ...,(A—hE) frs, (74.1) 


Montrons que ces vecteurs sont lineairement indépendants. 
En effet, construisons leur combinaison linéaire et égalisons-la 
à zéro. En appliquant aux deux membres de l’égalité obtenue l’opé- 
rateur (4 — À;E)'-!, nous trouvons que la combinaison linéaire 
des vecteurs f,, . .., f,, est transformée par l'opérateur (4 —À;E)*"! 
en le vecteur nul, c’est-à-dire qu'elle est un vecteur de H;,_,. Par 
conséquent, les coefficients affectés à ces vecteurs doivent être nuls. 
En appliquant maintenant à la mêmeégalité l'opérateur (À — À,E)‘-2, 
nous établissons d’une façon analogue que les coefficients affectés 
aux vecteurs de la deuxième ligne de (74.1) doivent être nuls eux 
aussi, etc. 

Notons que le choix des vecteurs f,, . .., fn, fait qu aucune 
des combinaisons linéaires non nulle des vecteurs de la i-ième ligne 
de (74.1) n'appartient à Æ;,_;. 

Complétons les vecteurs (4 — À;E) f1, ..., (4 — À;E)f,, par 
des vecteurs fpis1r + + +» fps de H,_1 tels que toute la collection 
obtenue soit linéairement indépendante et que la somme directe 
de son enveloppe linéaire avec Æ,-, donne H,_,. Il est clair que 
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ce sont des vecteurs principaux d'indice { — À, que ps, = My] — 
— m,- et qu'aucune combinaison linéaire non nulle de ces vecteurs 
n'appartient à {7,_.. Construisons encore une collection de vecteurs 


fpi+1; ... Îpes 


(À — ME) fpi+1 “3 (4 — AE) pas 


(A— AE) fs ce (A— ME) 2 fe. 


Par rapport à la collection de vecteurs (4 — À;E) f,, ... 

y (4 — ÂGE) pis fpssrs + + ++ fps ON peut démontrer les mêmes 

faits que dans le cas de la collection fa + -., fp,, en remplaçant, 

certes, { par { — 1. En passant de cette même façon aux sous-espaces 

tes His, . . ., H,, on obtient un système linéairement indépen- 

dant de k; vecteurs qui appartiennent au sous-espace principal À;. 

Les tableaux de la forme (74.1), (74.2) se terminent par le tableau 
constitué d'une seule ligne 


fp_u+ir er fp,. (74.3) 


Ces vecteurs appartiennent à }7,, c'est-à-dire ce sont des vecteurs 
propres et pr; = M — Mo 

Disposons les tableaux (74.1)-(74.3) de proche en proche de 
gauche à droite en alignant leurs dernières lignes et en introduisant 
des notations plus compactes pour tous les vecteurs. On obtient 
alors le tableau suivant: 

eus 
(t-1) (t—1) (t-1) (t-1) 
Eÿ nr €ps + Epitir 1 €ps à (74.4) 


(1) (1) (1) (1) (1) (1) 
€; , °) Epi : Epi+1 pas : °: Ep, tir ss Ep, - 


(74.2) 


L'indice des vecteurs de la première ligne de ce tableau est £, 
celui des vecteurs de la ligne suivante £{ — 1, etc. L'indice des vec- 
teurs de la dernière ligne est 1, c’est-à-dire l'opérateur À — À;E 
annule ces vecteurs. Chaque colonne du tableau définit un sous- 
espace invariant de l'opérateur À — À;E et, par suite, de l'opéra- 
teur À. Ces sous-espaces sont dits cuéliques: Les p, premiers sous- 
espaces cycliques sont de dimension f, les p, — p, sous-espaces 
suivants de dimension { — 1, etc. Les dernières colonnes déterminent 
les sous-espaces cycliques de dimension 1. Le sous-espace principal R; 
tout entier est une somme directe de p, sous-espaces cycliques indiqués. 

Ecrivons la matrice de l’opérateur induit dans un sous-espace 
cyclique. Supposons, par exemple, qu’on ait pris pour base les 
vecteurs et), e{2), ..., elt-1), el), Puisque 


(A — À E) e{1) == 0, (À — ME) es) — el), ve (A — ME) el — et-1) 
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il vient 
2 t t t—1 
Aef ae), 4e = je Le, .., 4e) = Ref 1 ef, 
Donc, la matrice de l'opérateur induit s'écrit: 


À, 14 0... 0 O 


Les matrices de ce type s'appellent cellules canoniques de Jordan. 

Construisons maintenant une base de l’espace en réunissant 
successivement des bases des sous-espaces principaux R,, R,, ..., R.. 
Choisissons pour base de chaque sous-espace principal À; les vecteurs 
du type (74.4), ordonnés successivement de bas vers le haut et de 
gauche à droite. Une base de l’espace ainsi construite s'appelle 
base principale. 

Dans une base principale la matrice J/ de l'opérateur À acquiert 
une forme appelée forme canonique de Jordan. C'est une matrice 
quasi diagonale composée de cellules de Jordan. Parmi ces cellules, 
les premières correspondent à la valeur propre À, et sont rangées 
dans l’ordre non croissant de leurs dimensions. Puis viennent dans 
le même ordre les cellules de Jordan associées à À,, etc. Ainsi 


(74.5) 


Certes, il se peut dans le cas général que certaines des celiules de 
Jordan d'ordre inférieur soient absentes. 
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Un opérateur dans un espace vectoriel définit ‘une classe des 
matrices semblables. En langage matriciel le résultat obtenu signifie 
que toute matrice carrée peut être réduite par une transformation 
de similitude à la forme canonique de Jordan. Evidemment, deux 
matrices carrées de même ordre sont semblables si et seulement 
si elles ont les mêmes formes. de Jordan. Aussi, la base étant 
fixée, 

Dans un espace complexe, deux matrices carrées de même ordre 
définissent le même opérateur si et seulement si elles ont les mêmes 
formes de Jordan. 


Exercices 


1. Soit z un vecteur principal d'indice v associé äune valeur propre À, 
d’un opérateur À. Montrer que si À; est une racine de multiplicité p du poly- 
nôme op (2), alors le vecteur v — œ (4) x est un vecteur principal d'indice r — 
— maxX{0, v — p} associé à la même valeur propre À,. Que peut-on dire du 
vecteur v, si À, n’est pas une racine du polynôme  (:)? 

2. Soient z un vecteur non nul arbitraire, œ (2) un polynôme de plus petit 
degré possible tel que @ (4) x = 0. Montrer que ® (z:) est un diviseur du poly- 
nôme caractéristique de l'opérateur 4. 

3. Montrer que toute matrice carrée peut être réduite à la forme canonique 
de Jordan d'un type unique à permutation des cellules de Jordan près. 

4. Montrer que si une matrice est semblable à une matrice J de (74.5), 
elle est également semblable à la matrice J’. 

95. Montrer que les matrices carrées À et 4” sont des matrices d un même 
opérateur. 

6. Soit J une matrice canonique de Jordan. Quel est la forme de la matri- 
ce JP pour p entiers positifs? 


$ 75. Opérateur adjoint 


À présent nous passons à l’étude des opérateurs linéaires dans 
un espace unitaire. Bien sûr, tous les résultats obtenus dans ce qui 
précède relatifs aux opérateurs dans un espace complexe restent en 
vigueur. C’est pourquoi nous n’étudierons que les propriétés supplé- 
mentaires des opérateurs associées à la notion d’orthogonalité. 
Parfois nous examinerons également des opérateurs d’un espace 
unitaire dans un autre espace unitaire. Dans notre étude le rôle 
essentiel reviendra à ce qu’on appelle opérateur adjoint. 

Soient X, Ÿ deux espaces unitaires. Un opérateur A* de Y 
dans X est dit adjoint d'un opérateur À de X dans Ÿ si n’importe 
quels vecteurs x € X, y E Ÿ satisfont à l'égalité 


(Az, y) = (x, A*y). (75.1) 


Théorème 75.1. Pour tout opérateur linéaire À il existe 
un et seulement un opérateur adjoint A*. 
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Démonstration. Choisissons dans X une base ortho- 
normée €, 2, + - -» m- Rappelons que tout vecteur x € À vérifie 
la décomposition 


z= D (x, ex) en. (75.2) 
k=1 


Si un opérateur A* existe, alors, d'après cette formule, on a pour 
tout vecteur yE Ÿ 


mn 
A°y a à (4° y, ex) ER 


ou, en tenant compte de (75.1), 


m m m 
Ay= 2 (ex, Aya à (Ae,. y) = 2 (y, Aex)en. (75.3) 


Or, cela signifie que si l'opérateur A* existe, il est unique. 

Considérons maintenant l'égalité (75.3) comme une définition 
de l’opérateur A*. On voit aisément que l’opérateur A* ainsi défini 
est un opérateur linéaire. Il vérifie aussi l’égalité (75.1). En effet, 
si l’on tient compte du fait que le système e,, e:, . . ., e,, est ortho- 
normé, alors, en appliquant (75.2), (75.3), on obtient; pour deux 
vecteurs x € X, y € Ÿ quelconques 


(Az, y)=(4 2 (x, ex)es, v)= 2 (z, ex) (4en, y), 
(x, A°y)=( À (x, eh) Eh >» (y, Aex) ex) = 
k=1 k=1 
= D (x, &)(y, Ae)= À (x, ex) (Aer, y). 
k:=1 R=—1 


Le théorème est démontré. 
L'opérateur adjoint A* est associé à l'opérateur À par certaines 
relations. Voici quelques-unes d’entre elles: 


(4*)° = 4, 
(A+ B)*=A*"+8B", 
(aA)* = a*A*, (75.4) 
(AB)*= B°A", 


(A) 1= (471. 
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Le trait sur «& traduit ici une conjugaison complexe. Toutes 
les relations se démontrent suivant le même schéma. C'est 
pourquoi nous n'examinerons que la première et la dernière 
propriété. 

Considérons un opérateur arbitraire À et son adjoint A*. A son 
tour, l'opérateur adjoint de A* est l'opérateur (4*)*. Maintenant 
on a pour EX, yE Ÿ quelconques 


(y, (4%) x) = (Ag, 2) = (7, 4°) = (47, ÿ)=(y, An). 


Pour tout vecteur y, le premier membre est égal au second membre. 
Par conséquent, (A*)*xr — Az. Cette égalité étant vérifiée pour 
tout vecteur zx, cela signifie que (A*)* = À. 

Supposons maintenant que À est un opérateur non dégénéré qui 
agit dans un espace X. Prouvons d'abord que l’opérateur A* est 
lui aussi non dégénéré. D'après (75.3), si A*y = O0, il vient 


> (y; Ae}) ex = 0. 


h=—1 
Le système de vecteurs e,, ..., em est une base, donc 
(y, 4ez) = 0 (75.5) 


pour tout Æ = 1,2, ..., m. L'opérateur À est non dégénére; par 
conséquent, il transforme toute base en une base. Alors le système 
de vecteurs Ae,, . .., 4e, est également une base et (75.5) entraîne 
que y = 0. Ainsi, le noyau de l'opérateur A* ne contient que le 
vecteur nul, c’est-à-dire c’est un opérateur non dégénére. 

Prenons des vecteurs arbitraires x, y € X. Il existe des vecteurs 
uniques u, v tels que 


Au = zx, Av = y. 


On trouve ensuite 


(x, (47) y)= (Az, y)=(u, A°v)= 
= (Au, v)=(z, (4°) y). 


Quel que soit le vecteur x, le premier membre est égal au second 
membre. Donc, (4-!)*y — (A*)-ly. Puisque y est arbitraire, cela 
sisnifie précisément que (4-1)* = (4®%)71. 
De nombreuses propriétés communes des opérateurs À et A* 
peuvent être établies en étudiant leurs matrices. Soient e,, e,, . .. 
., Em une base orthonormée dans un espace ZX ; Q1, Ge, - . ., Qn 
une base orthonormée dans un espace Ÿ. Si X coïncide avec Ÿ, 
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on peut admettre que les bases coïncident également. Supposons que 
la matrice À. aux éléments a;; correspond à l'opérateur À. Alors, 


Ae;— à dijqi. 
i=1 
On en tire d'après (75.2) que 
ay = (es, qi). (75.6) 


Supposons ensuite que, dans les mêmes bases, la matrice A4 


aux éléments aÿ correspond à l’opérateur A*. D'après la formu- 
le (75.6), on a 


a = (A*9;, ei). 


En comparant les éléments a;; et a et en tenant compte de (75.1), 
on obtient 


af (4*g;, e;)=(e;, A°g;) = (Aer, gj)= an. 


Cette formule justifie la définition suivante. 
Une matrice A* de type m X n aux éléments aï est dite adjointe 


d'une matrice À de type 7 X m aux éléments a;,, si a — a; pour 
tous à, j. 

Ainsi, dans des bases orthonormées quelconques aux opérateurs 
adjoints correspondent des matrices adjointes. Les matrices adjointes 
vérifient évidemment toutes les relations (75.4). Une matrice adjoin- 
te ÀA* est liée à la matrice À par les opérations de transposition 
et de conjugaison complexe. Plus précisément, 


A*=(4')= (4). (75.7) 


Le trait indique ici que tous les éléments de la matrice sont remplacés 
par leurs adjoints complexes. 

Le rang d'un opérateur coïncide avec celui de sa matrice. C’est 
pourquoi, d’après la formule (75.7), les rangs des opérateurs À 
et AÀA* sont les mêmes. 

Désignons par NE X, N' cYæ«TeY, T* € X respecti- 
vement les noyaux et les domaines des valeurs des opérateurs À 
et A*.SizEN, alors Ar = Oet (x, A*y) = 0. Ceci traduit le fait 
que le domaine des valeurs de l'opérateur A* est un sous-espace 
orthogonal au noyau de l'opérateur À. Il est évident que le domaine 
des valeurs de l'opérateur À est également orthogonal au noyau de 
l'opérateur A*. De l'égalité des dimensions des sous-espaces T, T* 
et des relations (56.4), on déduit que 


X = N@OT*, Y = N'@T. (75.8) 
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Une base y, Ye, - - ., Um d’Un espace unitaire X est dite duale 
à une base z;, Ze, . . ., Zm de Ce même espace si 
0 pour i}j, 
Ge v)=1 4 pour i=j. 


Une base duale est utilisée souvent pour étudier les propriétés 
communes aux opérateurs À et ÀA* qui agissent dans un même espace. 
Montrons d’abord que toute base possède une base duale et une 
seule. Soit z;, Ze, . - ., Tm une base arbitraire. Pour tout j, le 
vecteur y; doit être orthogonal aux vecteurs z;, . . ., Zj_1, Zj,us - . + 

+ Tm €t, par conséquent, orthogonal à l’enveloppe linéaire Z; 
de ces vecteurs. 11 s'ensuit que le vecteur y; appartient au sous- 


espace unidimensionnel LY. La condition de normalisation 
(z;, yy) — 1 le définit d’une façon unique. 

Il est clair qu’une base est duale à elle même si et seulement si 
elle est orthonormée. La relation de dualité des bases est symétrique, 
il serait donc raisonnable de parler d’un couple de bases duales 
l’une à l’autre. Deux bases duales l’une à l’autre sont dites biortho- 
normées. 

Théorème 75.2. Si dans une base la matrice d'un opérateur À 
est J, dans la base duale à la base donnée, la matrice de l'opérateur 
adjoint A* est J"*. 

Démonstration. Soient dans une base orthonormée 
Eyy Cas - + + Em des Opérateurs À et A* qui possèdent respectivement 
des matrices À, et A, et dans une base zx,, 22, . . ., Zm, l'Opéra- 
teur À qui possède une matrice J. Notons P la matrice de passage 
de la base e,, e., ..., en à la base x,, ze, . .., tm. D'après la 
formule (64.5), on a 


J = P"14,P. 


En passant aux matrices adjointes dans le premier et le second 
membre de cette égalité, on a 


J°=— P'AS (PT) 
ou, ce qui revient au même, 


J*=((7}) 1 AS (C1). 


La relation obtenue montre que l'opérateur adjoint A* possède 
la matrice J* dans la base y,, y:, . . ., yn pour laquelle la matrice 
du passage de la base e,, e., ... e, est (P”!)*. D’après la formule 
(63.3), les coordonnées des vecteurs zx;, Ze, . . ., Im dans la base 
Ci, C9 - + + Em SONt les éléments des colonnes de la matrice P, les 
coordonnées des vecteurs y, Ya, + +: > Ym dans la base e,, e., . . ., em 


Cl 
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sont des éléments des colonnes de la matrice (P-!)*. Le calcul des 
produits scalaires deux à deux des vecteurs de la base z;,,27e, . .. 
.… TIm Par les vecteurs de la base y,, ÿs, . . ., Ym équivaut au 


calcul des éléments de la matrice P°"(P”1) *. Or 


P'(P3ÿ = P'(P 1) = P'(P1) =(PAP) =E. 


{1 en résulte que la base y,, y, . . ., Um est duale à la base x,, ze, . .. 
TR 

Le théorème démontré conduit à de nombreux corollaires. Si, 
par exemple, J est une matrice canonique de Jordan, sa diagonale 
porte les valeurs propres À,, À+, . . .; Àm- Mais les valeurs propres 


de la matrice J* sont À,, À, ..., Am. C'est pourquoi toutes les 
valeurs propres de l'opérateur A* sont conjuguées complexes des 
valeurs propres de l'opérateur À. Si l’opérateur À est de structure 
simple, le théorème 75.2 permet de dire que la structure de l’opéra- 
teur adjoint A* est également simple. De plus, les systèmes de base 
des vecteurs propres des opérateurs À et A* peuvent être choisis de 
façon qu'ils soient biorthonormés, etc. 


Exercices 


1. Supposons que les coordonnées des vecteurs d’une base de l'espace eucli- 
dien données dans une base orthonormée e4, es, . . ., e,, forment les colonnes 
d'une matrice À. Montrer que les coordonnées des vecteurs de la base 
duale données dans la même base 6,,e+, . .., e,, forment les lignes d’une 
matrice À “1. 

2. Quelle est la liaison entre les polynômes caractéristiques des opérateurs À 
et A*? 

3. Montrer que si un sous-espace est invariant par rapport à un opérateur 4, 
son complément orthogonal est invariant par rapport à A*. 

4. Montrer que tout vecteur propre d’un opérateur À associé à une valeur 
propre À est orthogonal à tout vecteur propre de l'opérateur À * associé à une 
valeur propre u -£ À. 

5. Prouver que tout vecteur principal d’un opérateur À associé à une valeur 
propre À est orthogonal à tout vecteur principal de l'opérateur A4* associé à une 


valeur propre u = À. 


$ 76. Opérateur normal 


L'existence d’une base orthonormée de l’espace et d’une base 
formée de vecteurs propres d’un opérateur linéaire est d’un grand 
intérêt pour des recherches les plus différentes. Aussi, notre tâche 
immédiate est-elle d'étudier la classe des opérateurs dans un espace 
unitaire qui admettent des bases orthonormées composées de vecteurs 
propres. De tels opérateurs existent bien. Ce sont, par exemple, 
tous les opérateurs scalaires. 
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Théorème 76.1 (Théorème de Schur). Dans un espace unitaire 
il existe pour tout opérateur linéaire une base orthonormée dans laquelle 
la matrice de l'opérateur est triangulaire. 

Démonstration. Considérons, par exemple, le cas d'une 
matrice triangulaire supérieure. D’après le théorème 72.1, pour tout 
opérateur À il existe des sous-espaces invariants L,, p = 1,2,...,m, 
tels que la dimension de L, soit p et que chaque sous-espace d'indice 
inférieur fasse partie de chaque sous-espace d'indice supérieur. 
Pour construire la base recherchée, procédons de la façon suivante. 
Prenons comme vecteur e, un vecteur normé quelconque de Z,;, 
comme vecteur e, un vecteur normé de L, orthogonal à L,;, etc.; 
comme vecteur e», prenons un vecteur normé de L,, orthogonal 
à Lmh_,. La base e,, e., ..., en est orthonormée et, comme nous 
l'avons dit au $ 72, dans une telle base la matrice de l'opérateur 
est triangulaire supérieure. 

Un opérateur linéaire À s’appelle normal s'il est permutable 
avec son adjoint, c'est-à-dire si 


AA* = AA. 


Nous montrerons que dans un espace unitaire les opérateurs 
normaux et eux seuls possèdent des bases formées de vecteurs propres 
orthonormés. 

Pour étudier ces opérateurs il est utile de retenir la remarque 
suivante. Si une matrice triangulaire est permutable avec son adjoin- 
te, elle est diagonale. En effet, supposons, par exemple, qu'une 
matrice B de type m soit triangulaire supérieure et que B*B — BB*. 
Désignons les éléments de la matrice B par b;;. La condition qui 
annule les éléments diagonaux de la matrice B*B — BB* fournit le 
système suivant des équations par rapport aux éléments non diago- 
naux de la matrice B: 


— | die 2 — | bis — 161, PF — .. —|b,, F=0, 
| bu PP —1 Des — | Dai P— + —| Dam (2= 0, 
lue = "1B23 PF — 1 Bu F— ++ — lbs joue ; 


D L | bem 12 4-1 dm + the me 0) 


La solution unique du système donné étant nulle, la remarque 
énoncée se trouve justifiée. 

Théorème 76.2. Pour qu'un opérateur dans un espace unitaire 
soit normal, il faut et il suffit qu'il possède une base de vecteurs propres 
orthonormés. 

Démonstration. Soit À un opérateur normal. Choisissons 
d’après le théorème 76.1 une base orthonormée telle que la matrice 
de l’opérateur soit triangulaire. Dans cette même base à l’opéra- 
teur À* est associée la matrice triangulaire adjointe. Par hypothèse, 
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l'opérateur À est normal, c’est pourquoi dans la base choisie les 
matrices des opérateurs À et A* sont permutables. En vertu de la 
remarque faite dans ce qui précède, ces matrices sont diagonales. 
Ainsi, nous avons construit une base orthonormée dans laquelle 
la matrice de l'opérateur est diagonale: Cela signifie que la base 
concernée se compose des vecteurs propres de l'opérateur. 

Supposons maintenant qu’un opérateur À possède une base de 
vecteurs propres orthonormés. Dans cette base, la matrice de À est 
diagonale. Or, dans cette même base, à l'opérateur A* correspond 
la matrice adjointe qui, évidemment, est diagonale elle aussi. Les 
matrices diagonales sont toujours permutables, les opérateurs À 
et A* sont donc permutables eux aussi. 

Tout en démontrant le théorème nous avons prouvé que si un 
opérateur À est normal, alors, dans une base des vecteurs propres 
orthonormés, la matrice de l'opérateur A* est diagonale tout aussi 
bien que la matrice de l'opérateur À. Ceci implique le 

Corollaire. Si un opérateur À est normal, tout système 
orthonormé de vecteurs propres de l'opérateur À est un système ortho- 
normé de vecteurs propres de l'opérateur A* et inversement. 

Corollaire. Si un opérateur À est normal, les valeurs propres 
des opérateurs À et A* associées à un vecteur propre commun sont con- 
juguées complexes. 

En effet, si Az — Àr et A°x — ur, d'après (79.1), pour tout 
vecteur propre normé x, On a 


ÀA=(Àx, z)= (Ar, z)= (x, A*x)= (x, ur) = pu. 


Ce fait est vrai, évidemment, pour tout opérateur À possédant des 
vecteurs propres communs avec l'opérateur A*. La propriété de 
l'opérateur À d’être normal assure l'existence de vecteurs communs. 

Deux faits définissent l'intérêt des opérateurs normaux pour la 
théorie générale. D'abord, c’est l’une des classes les plus simples des 
opérateurs dans un espace unitaire. Et puis, en étudiant un opéra- 
teur quelconque on est souvent amené à examiner certains opéra- 
teurs normaux. 


Exercices 


1. Soit À un opérateur linéaire arbitraire, a, B des nombres complexes 
égaux en module. Montrer que l'opérateur a4 + BA* est normal. 

2. Soit À un opérateur normal. Prouver que, pour tout polynôme « (:), 
l'opérateur œ(4) est un opérateur normal. 

3. Montrer que pour un opérateur normal tout opérateur induit est normal. 

4. Montrer qu’un opérateur À est normal si et seulement si pour tout sous- 


espace invariant L son complément orthogonal LL est également invariant. 

5. Soit À un opérateur de structure simple dans un espace complexe. 
Prouver que l'opérateur À peut être rendu normal si l’on munit l’espace d'un 
produit scalaire convenable. 
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$ 77. Opérateurs unitaire et hermitien 


Parmi les opérateurs normaux Iles plus usités sont les opéra- 
teurs unitaire et hermitien. 

Un opérateur linéaire U est dit unitaire si son adjoint U* coïncide 
avec son inverse Url, c'est-à-dire si 


UU* = U*U = E. 


Théorème 77.1. Un opérateur normal U est unitaire si et 
seulement si toutes ses valeurs propres sont égales à l'unité en module. 

Démonstration. Soit U un opérateur unitaire. Considé- 
rons l’une de ses valeurs propres À et un vecteur propre normé zx qui 
lui correspond. On a 


1=(xz, z)= (x, U*Uzx) = (Uz, Ux)= (Az, x) — 
=) A(z, z)=lAF. 

Supposons maintenant que toutes les valeurs propres d’un opéra- 
teur normal U sont égales à l'unité en module. Désignons par 
Li + + «y Zm Iles Vecteurs propres orthonormés de l'opérateur U, 
et par À, + - +» ÀÂm Ses Valeurs propres. Par hypothèse, | À; | = 1 
pour tout i. Rappelons que pour l'opérateur adjoint U* les vecteurs 
Lis - + Tm restent des vecteurs propres, mais correspondent à des 


valeurs propres À, ..., Àm- Prenons un vecteur arbitraire x et 
décomposons-le suivant les vecteurs propres de l'opérateur U 


T=ATi+...+OmTm-. 
Calculons maintenant: 
| U*Uz=U"*(Uz)=U" (ait +... EL 'amÂmTm) = 
= CAL PEUT Test CE — 
= Ati+... EL EmTm=T. 
Le vecteur x étant arbitraire, cela signifie que U*U — E. D'une 
façon analogue, on prouve que UU* = E. 

Théorème 77.2. Un opérateur U est unitaire si et seulement 
si le produit scalaire de deux vecteurs quelconques est égal au produit 
scalaire de leurs images. 

Démonstration. Soit U un opérateur unitaire; alors 
pour deux vecteurs quelconques zx, y on a 

(x, y) = (x, U*Uy) = (Uz, Uy). (77.1) 

Supposons maintenant que quels que soient les vecteurs x, y, 

l'opérateur U vérifie les égalités (77.1). Il en résulte que 
(x, (U*U — E) y) = 0. 


Les vecteurs z, y étant arbitraires, cela signifie que U*U = E. 
L'opérateur U est non dégénéré, sinon l'égalité U*U = E serait 


$ 77. OPÉRATEURS UNITAIRE ET HERMITIEN 297 


impossible. Par conséquent, l’opérateur U-! existe. En multipliant 
l'égalité U*U = E à gauche par l'opérateur U, et à droite par 
l'opérateur U-!, on obtient l'autre égalité: UU* — E. Ainsi, 
l'opérateur U est un opérateur unitaire. 

Corollaire. Un opérateur U est unitaire si et seulement 
si soit UU* = E, soit U*U = E. 

Corollaire. Tout opérateur unitaire transforme tout système 
orthonormé de vecteurs en un système orthonormé. 

Corollaire. Si un opérateur linéaire U transforme une base 
orthonormée quelconque en une base orthonormée, U est alors un opéra- 
teur unitaire. 


En effet, soit z;, ..., rx, une base orthonormeée. Prenons deux 
vecteurs arbitraires x, y. Si 


| . 
— 2 Qiti, Y— 2 Pix, 
1=  — 


il vient 
m 


(x, y)= D ai. 


2=1 


En vertu de la linéarité de l'opérateur U 


< < 
Uz= 2 Œiyi Uy= à Pig - 


C'est pourquoi cette fois encore 


m 
(U?x, Uy)= 2 abs. 

1—= 
Ainsi, les égalités (77.1) ont lieu quels que soient les vecteurs x, y. 
Constatons que nous aurions pu définir un opérateur unitaire 
comme opérateur isométrique, c'est-à-dire comme opérateur qui 
conserve les longueurs de tous les vecteurs. Ceci résulte du théorè- 

me 77.2 et de la relation 


z 2—|2z—yl+i|lz+iyf—ti|r—iy | 
e, y} LÉ : yl2—ilz—iy| 


qui est facile à vérifier. 
Un opérateur linéaire Æ est dit hermitien ou auto-adjoint s'il 
coïncide avec son adjoint, c’est-à-dire si 


H = H*. 


Théorème 77.3. Un opérateur normal H est un opérateur 
hermitien si et seulement si toutes ses valeurs propres sont des nombres 
réels. 


17—01090 
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Démonstration. Soit À un opérateur hermitien. Choisis- 
sons une de ses valeurs propres À et un vecteur propre normé x qui 
lui correspond. On a 


A= (hr, z)=(Hz, x)=(x, H*z)=(x, Hz)=(x, x) =À, 


c’est-à-dire que À est un nombre réel. Supposons maintenant qu'un 
opérateur normal Æ ne possède que des valeurs propres réelles. 
Alors, dans une base composée de vecteurs propres orthonormés 
de l'opérateur Æ, les matrices des opérateurs Æ et H* coïncident. 
Par conséquent, les opérateurs eux-mêmes coïncident aussi, c'est-à- 
dire l’opérateur H est un opérateur hermitien. 

Un opérateur hermitien Æ est dit non négatif (défini positif) 
si pour tout vecteur x (non nul) on a l'inégalité 


(Hz, x) 2 0 (> 0). 


Théorème 77.4. Un opérateur hermitien H est non négatif 
(défini positif) si et seulement si toutes ses valeurs propres sont non 
négatives (positives). 

Démonstration. Choisissons une base orthonormée com- 
posée de vecteurs propres Z1, - : -; Tm d'un opérateur hermitien }. 
La décomposition 


Z = Er +... + Emtm 
d’un vecteur arbitraire x entraîne alors que 
(Hz, 2)= [EP + + 2 + + Âm | Em P- 


Ceci implique que si toutes les valeurs propres de l'opérateur hermi- 
tien sont non négatives (positives), l'opérateur lui-même est non 
négatif (défini positif). En adoptant x = x;, on obtient 


(Hi, ti) = 


pour tout i. Il s'ensuit que toutes les valeurs propres d’un opérateur 
non négatif (défini positif) sont non négatives (positives). 

Ce qui vient d'être dit amène qu'un opérateur défini positif est 
un opérateur non dégénéré non négatif. Parmi tous les opérateurs 
hermitiens, les opérateurs non négatifs et définis positifs jouent un 
rôle particulier. Voici certaines de leurs propriétés. 

Si H et S sont des opérateurs définis positifs, l'opérateur aH + $S 
est défini positif quels que soient les nombres non négatifs a, 6 non 
simultanément nuls. 

En effet, l'opérateur aH + BS est hermitien pour n'importe 
quels nombres réels a, B. Mais si ces nombres sont non négatifs 
et non simultanément nuls, il vient 


((aH + BS) x, x) = a (Hz, x) + B (Szx, x) > 0 
pour z # 0. 
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Si unopérateur H est défini positif, l'opérateur H”!\ est également 
défini positif. 

En effet, puisque 4 = H*, alors H-! = (H*)-1—(H-1)*, c’est-à- 
dire que l'opérateur A”! est hermitien. Les valeurs propres de 
l'opérateur H”! sont les inverses des valeurs propres de l’opérateur YH. 
C'est pourquoi elles sont positives, et l'opérateur HA”! est défini 
positif. 

Si H est un opérateur défini positif et À un opérateur non dégénéré 
arbitraire, les opérateurs A*HA et AHA* sont définis positifs. 

On vérifie aisément que ces opérateurs sont hermitiens. L’opéra- 
teur À étant non dégénéré, pour tout x = 0 on a Az Æ 0 et A*xr -£ (0. 
Donc 

(A*H Az, x) = (HAzx, Az) > 0, 


(AHA%z, zx) = (HA*zx, A*zx) > 0 


pour x = 0. On en tire en particulier que pour tout opérateur non 
dégénéré À, les opérateurs A*A et AA* sont définis positifs. Or, si À 
est un opérateur dégénéré, les opérateurs A*A et AA* sont non 
négatifs. 

Pour tout opérateur H non négatif il existe un opérateur S non 
négatif tel que S° = H. 

En effet, soient À,, . .., ÀM les valeurs propres de l'opérateur H 
et 2j, . .- ., Tm, SeS Vecleurs propres orthonormés correspondants. 
Alors, Hz; = À;x; pour tout i. Définissons l'opérateur S par les 
égalités Sz;, — V'A:x;. L'opérateur S est non négatif puisque ses 
vecteurs propres orthonormés zx, . .., Im associés aux valeurs 
propres non négatives VA, . .., VÂm forment une base. Par ail- 
leurs, S°zx; — Hz; — À;x;. Ainsi, les opérateurs S* et H coïincident 
sur les vecteurs de la base z,, - .., x, ; ils coïncident donc sur 
tous les vecteurs, c’est-à-dire S° — X. 

Un opérateur $S non négatif s'appelle racine carrée arithmétique 
de l'opérateur H non négatif si S° = H. 

T1 importe de souligner que tous les vecteurs propres des opéra- 
.teurs $ et Æ coïncident. En effet, supposons que À, ..., À, et 
VA... VA, sont toutes les valeurs propres distinctes des opéra- 
teurs H et S respectivement. Notons X; (Y;), i = 1, 2,...,7r, 
le sous-espace propre de l'opérateur H (S) qui contient tous les 
vecteurs propres associés à la valeur propre À; (V À;). Les sommes 
directes des sous-espaces propres X,, ..., À, et Y;,,.. 
coïncident avec l’espace tout entier. C’est pourquoi 


dimX,;, +...+dimX,=dimY,;+...+dimY,. (77.2) 
Il est clair que Ÿ, € X; pour tout à, c’est-à-dire que dim Ÿ, < 


< dim X;. Par conséquent, l’égalité (77.2) ne peut avoir lieu que 
si pour tout à on a l'égalité dim ŸY,; = dim X ;, c’est-à-dire Y, = X;. 


17% 


LE | Fr 
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Ainsi, les vecteurs propres et les valeurs propres de l'opérateur S 
sont bien définis par l’opérateur H. Etant donné que S est un opéra- 
teur hermitien, cela signifie que la racine carrée d'un opérateur H 
ne peut être qu'unique. 


Exercices 


1. Montrer que l’ensemble de tous les opérateurs unitaires dans un espace 
unitaire donné est un groupe multiplicatif. : 

2. Prouver que l'ensemble de tous les opérateurs hermitiens dans un espace 
hermitien donné est un groupe additif. 

3. Soient À un opérateur hermitien, Z un opérateur défini positif. Montrer 
que les valeurs propres des opérateurs BA et B-lA sont réelles. 

4. Prouver que si À, B sont des opérateurs définis positifs, toutes les valeurs 
propres de l'opérateur BA sont positives. 

5. Montrer que si 4, B sont des opérateurs définis positifs permutables, 
l'opérateur BA est également un opérateur défini positif. 

6. Montrer que si 4 est un opérateur défini positif daus un espace unitaire, 
la fonction (r, y)A = (Ar, y) satisfait à tous les axiomes du produit scalaire. 
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Si À est un opérateur d'un espace unitaire À dans un espace 
unitaire Ÿ, alors dans X est défini l'opérateur A*A, et dans Ÿ 
l'opérateur AA*. Nous allons étudier ces opérateurs parce qu'ils 
jouent un rôle important dans les recherches qui suivent. 

La première et la quatrième propriétés (75.4) entraînent que les 
opérateurs A*A et AA* sont hermitiens. En outre, ils sont non 
négatifs du fait que, pour n’importe quels vecteursx € À,yEY,ona 
| (A*Az, x) = (Az, Az) > 0, 

I(AA*y, y) = (A*y, A*y) 2 0. 
C'est pourquoi dans l’espace X il existe un opérateur G non négatif, 
et dans l’espace Y un opérateur F non négatif tels que 


A*A =G, AA* = F. 


Les opérateurs G et F qui vérifient ces relations sont uniques. 
Quel que soit l'opérateur À, l'opérateur A*A possède un systè- 

me orthonormé de vecteurs propres Zi, Ta + - y Zm- L'Opérateur À 

transforme ce système en un système orthogonal. En effet, soit 


VA*Azg = Phthr Pr >0 (78.1) 
pour tout # — 1,2, ..., m. Il vient 
(Az», Azr) =(4" Az, x) = (x, 21) =0 
pour #4 Æ !. De plus, pour tout k 
| Az | = px; 
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le vecteur Az, est donc non nul si et seulement si la valeur propre 
of de l'opérateur A*A n'est pas nulle. 

Le vecteur Az, non nul est un vecteur propre de l'opérateur AA*, 
il correspond à la valeur propre pf. En effet, d’après (78.1), 


AA* (4z3)= À (A*Azs) = À (paza) = PkAzs. 


Ainsi, toutes les valeurs propres non nulles de l’opérateur A*A 
sont des valeurs propres de l’opérateur AA*. Bien sûr, la réciproque 
est également vraie. C’est pourquoi les valeurs propres non nulles 
des opérateurs A*A et AA* coïncident toujours. 

Les valeurs propres des opérateurs A*A et AA* seront notées 
pi, p5, - .. De plus, sans restreindre la généralité, on peut admettre 
que 


Pi>pr>...>pi>0, 


alors que les autres valeurs propres pé sont nulles. Les valeurs propres 
des opérateurs A*A et AA* ne diffèrent évidemment que par la 
multiplicité de la valeur propre nulle. Elle vaut (m —1t) pour 
l'opérateur A*A, et (7 — t) pour l’opérateur AA*. 

Les valeurs arithmétiques des racines carrées des valeurs propres 
communes aux opérateurs A*A, AA* sont appelées nombres singu- 
liers (ou principaux) de l'opérateur À. 

En utilisant les vecteurs propres des opérateurs A*A et AA* 
on peut construire des bases orthonormées dans les espaces X et Y 
qui permettent de décrire le comportement des opérateurs À et A*. 
Choisissons comme base dans l’espace X un système orthonormé 


Ti + - «> Im de vecteurs propres de l'opérateur A*A. Comme il 
résulte de (75.8), les vecteurs x;, . .., x, forment une base dans T*, 
les vecteurs xy31, . . ., Tn une base dans NW. Construisons de la 
façon suivante une base orthonormée y,, ..., y, dans l’espace Y. 
Prenons comme y,, ..., y, les vecteurs obtenus par normalisation 
à partir de Azx;, ..., Azx,. Ces vecteurs forment une base dans T. 
Pour yy41, - : -, Un prenons n'importe quelle base orthonormée 
dans WN*. Il est clair que les vecteurs y,, . . ., y. sont des vecteurs 
propres de l’opérateur AA* et forment une base dans Y. En tenant 
compte de | Az: | = px, on trouve maintenant 


4: ={ PAYR: k<, 
À 0" h>t. 


En multipliant ces égalités par l'opérateur A* et en tenant compte 
de (78.1), on obtient 


(78.2) 


Pxtr At, 


A"yr = 0, k>t. (78.3) 
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Les bases orthonormées des espaces À, Y associées aux opéra- 
teurs À, A* par les relations (78.2), (18.3) s'appellent bases singu- 
lières. 

Si les espaces À, Y sont distincts, écrivons la matrice de l'opé- 


rateur À dans deux bases singulières. Désignons-la par A. D'après 
(78.2), elle est de la forme 


Pi 0 


AÂA= 0 “ : (78.4) 


Si les espaces X, Ÿ coiïncident, les bases singulières ne s'utilisent 
pas généralement pour écrire la matrice de l'opérateur. Pourtant, 
les relations (78.2), (78.3) ont encore lieu, 


Exercices 


1. Montrer que les noyaux des opérateurs 4, A*A (4*, AA*) coïncident, 
de même que les domaines des valeurs des opérateurs 4, 44° (4*, 4*4). 

2. Montrer que si dim X > dim Y (dim X < dim Y), l'opérateur 4*A4 (44%) 
est dégénéré. 

3. Prouver que la multiplication de l'opérateur À par n'importe quel 
opérateur unitaire ne change pas les nombres singuliers. 

4. Supposons que tous les nombres singuliers d’un opérateur À dans un 
espace X soient distincts deux à deux. Montrer que les bases singulières sont 
définies d'une façon univoque à la multiplication de chaque vecteur par un 
nombre égal en module à l’unité pres. 

5. Montrer que les nombres singuliers d'un opérateur normal coïncident 
avec les modules des valeurs propres. 

6. Prouver que les nombres singuliers de l’opératour À -! sont les inverses 
des nombres singuliers de l’opératour 4, alors que les bases singulières des deux 
opérateurs coïncident. 

7. Soit À un opérateur dans un espace unitaire X de dimension m. Notons 


his + + + Àm Ses Valeurs propres et p,, . .., fn ses nombres singuliers. Montrer 
que 
m m : m m 
D'imMP< Des [| Eul= [I ex. 
k=—1 k=—1 kR=—1 k=1 
8. Montrer]que si | A, | = p, pour tout k = 1, 2, ..., m, l'opérateur 


est normal. 
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$ 79. Décompositions d’un opérateur arbitraire 


L'une des circonstances qui déterminent l'importance des opéra- 
teurs unitaire et hermitien est la possibilité de représenter un opéra- 
teur linéaire quelconque par des opérateurs de ces types. 

Soit À un opérateur linéaire quelconque dans un espace unitaire 
X. Montrons qu'on peut toujours le mettre sous la forme 


A=H, +iH, (79.1) 


où À, et H, sont des opérateurs hermitiens. En effet, si cette décom- 
position existe, il vient 


A* = À, —— 1H :. 
Mais alors, 
Hi=z(A+ 4), Hi=(A—A*). 
Les formules obtenues définissent la décomposition (79.1). Puisque 


HiH2—H3H1=-7 (AA — AA°), 


le fait que l'opérateur À est normal entraïne que les opérateurs 7,, 
H, sont permutables, et inversement. 

Soit Zys + - -y Tm UD Système orthonormé de vecteurs propres de 
l'opérateur A*A. D'après (78.2), il existe un système orthonormé 
Yis + + > Um de Vecteurs propres de l'opérateur AA* tel que 


Ar = Pay (79.2) 


pour tout k. Définissons maintenant les opérateurs linéaires F et U 
dans l’espace X par les égalités suivantes sur les systèmes de base 


Ur = Yrs Fyr = Orÿn. (79.3) 


Les relations (79.2), (79.3) traduisent le fait qu'on a obtenu la 
décomposition 


A = FU. (79.4) 
Ici F est un opérateur hermitien non négatif, puisqu'il admet une 
base orthonormée des vecteurs propres y;, Ye, - - ., Ym et des valeurs 
propres non négatives Pi, Pas - + «+» Pm- L'opérateur Ü est un opéra- 
teur unitaire, puisqu’il transforme le système orthonormé de vecteurs 
Lis Toy + - 5 Tm en Système orthonormé y, Y:, : - .; Ym- Notons 
que (79.4) implique 

AA* = F?, (79.5) 


c'est-à-dire F est la racine carrée arithmétique de l’opérateur AA*. 
La décomposition (79.4) est appelée décomposition polaire de 
l’opérateur À. En vertu de l’unicité d'une racine arithmétique, 
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l’opérateur"F d’une décomposition polaire est unique. L'opéra- 
teur ÜU n’est unique que lorsque l'opérateur À est non dégénéré. 
Dans ce cas U — F”1A. 

Là encore il existe une liaison directe entre la normalité d'un 
operatéur À et la permutabilité des termes de la décomposition 
polaire. En effet, soit UF — FU pour un opérateur quelconque À. 
Il vient 


A*A = U*F*FU = F*U*UF = F*, 


ce qui traduit avec (79.5) la normalité de l'opérateur À. 

Supposons maintenant qu’un opérateur À est normal, c’est-à- 
dire que A*A — AA*. D'après (79.4), on a À = FU. Par consé- 
quent, A* = U*F. L'opérateur étant normal, on a l'égalité U*F*U — 
= F* ou 


F°U = UF. 
Si l’on tient compte de la deuxième relation (79.3), on obtient 
F2 (Uyx) = P$ (Uyx) 


pour tout k = 1,2, ..., m, c’est-à-dire que les vecteurs Uy, 
sont des vecteurs propres de l'opérateur F*. Comme nous l’avons 
constaté dans ce qui précède, les opérateurs F° et F ont les mêmes 
vecteurs propres; donc 


(FU) ya = F (Uyx) = px (Uyx) 


pour tout À — 1,2, ..., m. D'autre part, d'après la deuxième 
relation (79.3), 


(UF) y = U (Fyx) = U (payx) = px (Uyx). 


Les égalités obtenues montrent que les opérateurs FU et UF 
coïncident sur le système de base de vecteurs y, Y2, - - -» Ym- 
Par conséquent, UF = FU. 


Exercices 


4. Montrer que si un opérateur est normal, les valeurs propres de l'opéra- 

teur H, (resp. L,) de (79.1) sont des parties réelles (resp. imaginaires) des valeurs 
propres de l'opérateur À. 
2. Prouver que si un opérateur À est normal, les valeurs propres de l'opé- 
rateur F (resp. arguments des valeurs propres de l'opérateur U) de (79.4) sont 
les modules des valeurs propres (resp. arguments des valeurs propres non nulles) 
de l'opérateur À. 

3. Montrer que si un opérateur À est normal, les deux opérateurs de la 
décomposition (79.1) ont les mêmes vecteurs propres Le l'opérateur 4. Que 
peut-on dire des vecteurs propres des termes de la décomposition (79.4)? 
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$S 80. Opérateurs dans un espace réel 


L'étude des opérateurs linéaires dans un espace réel donne lieu 
à des difficultés supplémentaires. Elles sont dues essentiellement 
au fait que dans un espace réel les opérateurs linéaires ne sont pas 
tous à posséder au moins un vecteur propre. 

Si dans un espace réel le polynôme caractéristique d’un opéra- 
teur ne possède que des racines réelles, en théorie l’analogie est 
évidemment totale. Il n’y a au fond que la terminologie qui change. 
En particulier, les termes « complexe », « unitaire », « hermitien » 
sont remplacés respectivement par les termes « réel », « orthogo- 
nal », « symétrique ». Mais si le polynôme caractéristique possède 
des racines complexes, l'étude d’un tel opérateur devient bien plus 
compliquée. 

Soit R un espace réel. Considérons l’ensemble de tous les cou- 
ples (x; y) des vecteurs zx, y de R. Déterminons les opérations sur ces 
couples. Posons 


(G; y) +(u;v) = (x +u; y +v) 
pour deux couples quelconques, et 
(E +in) (x; y) = (Ex — ny; nz + Ey) 
pour le nombre complexe E + in et le couple (zx; y). On vérifie 
sans peine que l’ensemble de tous les couples de vecteurs de À avec 
les opérateurs ainsi introduits constitue un espace complexe C. 
La dimension de l'espace C ainsi construit est la même que 


celle de l’espace R. En effet, soit e,, e., . . ., en une base dans À. 
Pour tout couple de vecteurs u, v de R, on a 


U= ei hoc + ŒEmêm | 
80.1 
U— Pres + + + Pmêm re 
où «&;, B4 sont des nombres réels. Mais ceci implique que 
3 v)= 2 (an + if) (en: 0). ” (80.2) 


Le système (e,; 0), ..., (em; 0) est linéairement indépendant, 
c'est pourquoi l'espace C est de dimension m. 

Toute base e,, . . ., e, de l’espace R et les nombres réels a;, ... 
.. Am quels qu’ils soient vérifient l'égalité 


à (œx + i0) (ex ; 0) — (2 anen ; 0). 


Par conséquent, il existe entre tous les vecteurs uv de R et tous les 
couples de la forme (u; 0) de C une correspondance biunivoque. 
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De plus, si l’on se borne aux opérations sur les nombres réels, cette 
correspondance est un isomorphisme. 

Si l’on identifie chaque couple de la forme (u; 0) aux vecteurs u 
de R eux-mêmes, alors (80.1), (80.2) amènent que l’espace C peut 
être considéré comme ensemble des éléments 


W = U + il, 


où u, v € R. Certes, il faut encore retenir qu'en fait les éléments u, 
v sont des couples (w; 0), (v; 0), et que la multiplication par le 
nombre à et l'addition se font suivant les définitions données dans 
ce qui précède. Pour v = 0, on obtient les éléments de l’espace À. 
Il est naturel d'admettre que cet espace est un ensemble tiré de C. 
Pour les éléments de la forme uw + i0 nous dirons éléments réels, 
et pour les éléments de la forme u + iv et u — iv éléments conjugués 
complexes. 

L'espace C s'appelle extension complexe de l’espace réel R. 

Pour résoudre de divers problèmes dans un espace euclidien, 
nous pouvons d'une façon analogue étendre cet espace sur l’espace 
unitaire. Considérons l'extension complexe C d’un espace eucli- 
dien À. Pour deux vecteurs quelconques 


2=r+iy, W=u+iv 


de C adoptons par définition que 
(z, w) = ((x, u) + (y, v)) + à ((y, u) — (x, v)). 


On établit aisément que l’espace C muni d’un tel produit scalaire 
devient espace unitaire. Dans ces conditions le produit scalaire 
de deux vecteurs quelconques de À se conserve. 

Soit À un opérateur dans l'espace À. Construisons un opérateur 
A dans l’espace C qui coïncide avec l'opérateur À sur les vecteurs 
de À. À cet effet, posons 


À (u+ iv) = Au + iAv. 


Il est clair que l'opérateur À est linéaire et que Au = Au pour tous 
les vecteurs u € À. 

L'opérateur À se nomme prolongement de l'opérateur À sur l’espace 
complexe C. 

À présent, au lieu d'étudier l'opérateur À dans l’espace réel R 
on peut examiner l'opérateur À dans l’espace complexe C et analy- 
ser son comportement dans À comme dans un ensemble de l’espa- 
ce C. C'est la méthode qu'on emploie le plus souvent si un fait ayant 


lieu dans un espace complexe ne trouve pas d’analogie dans un espa- 
ce réel. 


$ 80.] OPÉRATEURS DANS UN ESPACE RÉEL 267 


Supposons qu'on ait choisi dans l’espace complexe C une base 
réelle. Dans une telle base, la matrice de l'opérateur prolongé À 
est réelle, elle coïncide dans la même base avec la matrice de l’opé- 
rateur À. Il s'ensuit que le polynôme caractéristique de l'opé- 
rateur À coïncide avec le polynôme caractéristique de l'opéra- 


teur À et, par conséquent, possède des coefficients réels. Il est évi- 
dent que 

Si le polynôme caractéristique d'un opérateur À dans un espace 
réel R possède une racine réelle, cette racine est une valeur propre 


de l'opérateur À à laquelle est associé au moins un vecteur propre 
réel. 


Considérons maintenant une racine complexe quelconque À 
du polynôme caractéristique de l'opérateur À. C'est une valeur 


propre de l'opérateur À à laquelle est associé un vecteur propre w. 


Les coefficients du polynôme caractéristique de l'opérateur À étant 
réels, cet opérateur possède également une valeur propre conjuguée 
complexe À. L'opérateur À transforme les vecteurs conjugués com- 
plexes en vecteurs conjugués complexes ; il s'ensuit que Âw = Àw 
entraîne ÀAw = Âw. Donc, aux valeurs propres conjuguées complexes 
de l'opérateur À correspondent les vecteurs conjugués complexes. 


Si À, les vecteurs w, w sont linéairement indépendants 
comme des vecteurs propres associés à des valeurs propres distinctes. 

Considérons les vecteurs x, y définis de la façon suivante par w, 
u: 


= (+, y=+ (un). (80.3) 


On vérifie sans peine qu'ils sont réels. De plus, il est facile d'établir 
que si À = u + iv, il vient 


AT =UT —Vy, ÀAy = vx + uy. 


Il en résulte que dans l’espace À l’enveloppelinéaire des vecteurs (80. 3) 
est un sous-espace invariant de l'opérateur À. La matrice de l'opé- 
rateur induit sur ce sous-espace dans la base (80.3) s'écrit 


En, 


Ceci implique que le polynôme caractéristique de l’opérateur induit 
est égal à (2 — u)° + v* ou, ce qui revient au même, à 2° — (À + À): + 
+ AÀ. Constatons que dans le sous-espace invariant construit, 


l'opérateur À ne possède aucun vecteur propre pour v 0. Ainsi, 
nous avons abouti à la conclusion importante suivante: 
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Si dans un espace réel R le polynôme caractéristique d'un opéra- 
teur A possède une racine complexe (non réellel), à cette racine dans 
l'espace R est associé un sous-espace invariant bidimensionnel de l'opé- 
rateur À qui ne contient pas de vecteurs propres. 

L'intérêt de cette conclusion pour l’étude des opérateurs dans 
un espace réel est le même que celui de l’existence au moins d'un 
vecteur propre pour l’étude des opérateurs dans un espace complexe. 
En choisissant convenablement les bases dans l’espace À on peut 
mettre la matrice d’un opérateur sous une forme dans un certain 
sens analogue soit à la forme diagonale, soit à la forme triangulaire, 
soit encore à la forme canonique de Jordan. Il est relativement rare 
qu'on recourt à ce mode pour étudier un opérateur, du fait que les 
formes canoniques réelles sont privées de nombreux mérites que 
présentent les formes canoniques complexes. Il est bien plus facile 
et plus avantageux d'étudier le prolongement de l’opérateur sur 
l’espace complexe. 


Exercices 


4. Montrer que le domaine des valeurs (le noyau) de l'opérateur À est 
une extension complexe du domaine des valeurs (du noyau) de l'opérateur 4. 


2. Soit À un opérateur prolongé de structure simple. Montrer qu'on peut 
choisir dans l'espace À une base telle que la matrice de l'opérateur À soit d'une 
forme quasi diagonale comportant des matrices d’ordre 1 et 2 sur la diagonale. 

3. Montrer que dans un espace réel À de dimension m tout opérateur pos- 
sède un sous-espace invariant de dimension m — 1 ou m — 2. 

4. Quel est l’analogue du théorème 72.1 pour un espace réel? 

5. Montrer que tout opérateur linéaire dans un espace réel de dimension 
‘ impaire possède au moins un vecteur propre. 


$ 81. Matrices de formes spéciales 


Nous venons d'étudier certains opérateurs de forme spéciale. 
I] est naturel de supposer que les matrices de ces opérateurs se dis- 
tinguent également par des traits particuliers. 

Une matrice carrée U est appelée matrice unitaire si son adjointe 
U* coïncide avec son inverse U-!, c’est-à-dire si 


UU* = U*U = E. 


Rappelons que, dans une base orthonormée, à l'opérateur adjoint 
-Correspond la matrice adjointe. Par conséquent, dans une base 
orthonormée, la matrice d'un opérateur unitaire est. une matrice 
unitaire. 

Soient dans un espace unitaire deux bases orthonormées quelcon- 
ques. Construisons la matrice de changement de base. D'après la 
formule (63.3), les colonnes d’une telle matrice sont composées 
des coordonnées des vecteurs de la deuxième base dans la première 
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base. Or, la forme de la matrice de l'opérateur linéaire qui trans- 
forme les vecteurs de la première base en ceux de la deuxième base 
est la même. D’après le deuxième corollaire du théorème 77.2, cet 
opérateur est unitaire. Donc 

La matrice de passage d'une base orthonormée à une base orthonormée 
est unitaire. 

Nous dirons que deux matrices sont semblables au sens unitaire 
si elles sont semblables et si la matrice de la transformation de 
similitude est une matrice unitaire. Les propriétés d’un opérateur 
unitaire entraînent que toute matrice unitaire est semblable au 
sens unitaire à une matrice diagonale aux éléments diagonaux égaux 
à l’unité en module. 

Il est facile d'écrire les relations de définition des éléments d'une 
matrice unitaire. Soit ÜU une matrice d'ordre m. Deésignons ses 
éléments par u;;. On tire alors de l'égalité UU* = E que 

nn 0, si i-j, 
2 tan = | 1, si i= j. 


k—= 1 


D'une façon analogue, l'égalité U*U = E donne 


mn. 0, si ii, 
D UiUhj = 


h=1 1, Si D — J- 


Ainsi, le système de vecteurs lignes et celui de vecteurs colonnes 
de toute matrice unitaire sont des systèmes orthonormés. 

Une matrice unitaire réelle U est dite orthogonale. Une telle 
matrice est définie par les relations 


UU" = U'U = E. 


Toutes les propriétés des matrices orthogonales se déduisent des 
propriétés des matrices unitaires. 

Une matrice carrée complexe À est dite hermitienne ou auto-adjointe 
si elle coïncide avec son adjointe, c’est-à-dire si 


H = HS. 


Ainsi, dans une base orthonormée, la matrice d’un opérateur hermi- 
tien est une matrice hermitienne. 

Les propriétés d’un opérateur hermitien entraînent que toute 
matrice hermitienne est semblable au sens unitaire à une matrice 
diagonale réelle. Si k;, sont les éléments d'une matrice hermitienne A, 
il vient 

hij= hi 


pour tout ë, j. On en tire en particulier que les éléments diagonaux 
de toute matrice hermitienne sont réels. 
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Une matrice hermitienne réelle est dite symétrique. Une telle 
matrice est definie par la relation 


H = H'. 


Notons que toute matrice symétrique est semblable au sens ortho- 
gonal à une matrice diagonale réelle. 

Une matrice carrée est dite normale si elle est permutable avec 
son adjointe. 

D'après cette définition, la matrice d’un opérateur normal dans 
une base orthonormée est normale. En tenant compte des propriétés 
d'un opérateur normal, on comprend aisément que toute matrice 
complexe normale est semblable au sens unitaire à une matrice 
diagonale. 

Les matrices de formes spéciales jouent un grand rôle dans la 
construction des algorithmes de calcul numérique. Mais nous ne les 
étudierons pas de près. Toutes leurs propriétés reflètent au fond les 
propriétés analogues des opérateurs correspondants. 


Exercices 


4. Montrer que toute matrice complexe est semblable au sens unitaire 
à une matrice triangulaire. 
2. Soient À, Àe, . - ., Àm les Valeurs propres d'une matrice À ; de plus, 


chaque valeur propre est prise dans l’ordre de sa multiplicité. Montrer que 


SIA < tr (4%). (81.1) 


i= 1 


| 3. Montrer que dans la relation (81.1) l’égalité a lieu si et seulement si la 
matrice À est normale. 

4. En utilisant la formule de Binet-Cauchy montrer que pour toute matri- 
ce À les mineurs principaux de la matrice A*A sont non négatifs. 

5. Prouver que la somme de carrés des modules de tous les mineurs disposes 
dans n'importe quelles lignes (ou colonnes) fixes d’une matrice unitaire est 
égale à l'unité. 

6. Montrer que toute matrice rectangulaire À peut être mise sous la forme 
A — QAS, où Q@, S sont des matrices unitaires, À une matrice diagonale aux 
éléments non négatifs. 


CHAPITRE 10 


PROPRIÉTÉS MÉTRIQUES D'UN OPÉRATEUR 


$ 82. Opérateur continu et opérateur borné 


Nous avons introduit la notion d’opérateur linéaire comme une 
généralisation de la notion de fonction. Si nous supposons que les 
espaces sont munis de métrique, nous pourrons envisager une analo- 
gie avec les fonctions bornées, continues, etc. En étudiant ces ques- 
tions nous admettrons toujours qu’un opérateur agisse d’un espace 
normé À de dimension m dans un espace normé Ÿ de dimension 7. 
Si XÀ ne se confond pas avec Ÿ, les normes des deux espaces peuvent 
être introduites indépendamment l’une de l’autre. 

Un opérateur À de X dans Ÿ est dit continu en un point x, € X 
si la condition x; —+ x, implique Az; — Az, pour toute suite {x;} 
de X. Si un opérateur est continu en tout point de l’espace X, on 
l'appelle partout continu ou simplement continu. 

Théorème 82.1. Un opérateur linéaire agissant dans des 
espaces normés arbitraires de dimensions finies est continu. 

Démonstration. Prenons un vecteur arbitraire x, € X 
et choisissons dans X n'importe quelle base e,, €, . .., em- On a 


0 0 
to= Ve +... + Elem. 
Supposons que zx, —> z, et que 
k k 
Th = EVe, +... + En/em 


D'après le théorème 53.1, la convergence en norme entraîne la 
convergence par coordonnées. Donc, E*) — E(0) pour tout s. Mais 


Axzo= EN Ae, + ...+EU 4e, 
et, de plus, 
Ar = EN A4e,+...+EN4e,. 


A présent, pour tout s, la convergence E!* — E! entraîne la con- 
vergence Az, — Az, en norme de l’espace Y. 

Un opérateur À est dit borné s’il existe une constante W telle 
que | Az | << M [1x || pour tout vecteur x € X. 
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Théorème 82.2. Un opérateur linéaire agissant dans des 
espaces normés arbitraires de dimensions finies est borné. 
. Démonstration. Supposons que dans l’un quelconque 
des cas l’opérateur À n’est pas borné. Il se trouve alors une suite 
{z,.} de vecteurs non nuls telle que 


Il Azx 12 & [zx 


Examinons la suite de vecteurs 


1 
= ————————— Z 
PR Ta] * 


Elle converge vers zéro, de 


bn 


Ya = ET || mU=r-0. 
D'autre part, 


1 
Age Er 42 121 


Cela signifie que la suite {Ay;} ne converge pas vers zéro, c’est-à-dire 
que l’opérateur À n'est pas continu au point zéro. Cette contra- 
diction par rapport au théorème 82.1 achève la démonstration. 
Il est naturel de poser la question sur la plus petite des constan- 
tes :Z vérifiant la condition || Az | < M || x || pour tout vecteur zx. 
L'ensemble de ces constantes étant borné inférieurement par le 
zéro, la plus petite constante existe bien. Elle s'appelle norme de 
l'opérateur À et se note || À ||. D’après la définition, la norme d'un 
opérateur jouit de deux propriétés suivantes: 
4) tout opérateur x de l’espace X vérifie l'inégalité 


Il 4x [<< 1 A4 1-1 z ||, (82.1) 
2) pour tout nombre & > 0 il existe un vecteur x, € À tel que 
I Axe > (À 1 — €) ze I. (82.2) 
Prouvons que 
I AI= sup || Az ||, (82.3) 
x 1I<1 


ou, ce qui revient au même, 
Az 
| 4 11= sup NAIL 
x#-0 


TI (82.4) 


si, certes, dim À > (. 
Considérons un vecteur arbitraire z qui satisfait à FINEARe 
| z || S 1. Alors (82.1) entraîne 


Az << 14 N1z << ITA HN. 
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LE 
=] 
[S) 


Par conséquent, 
sup || 4z||<!II À ||. (82.5) 
I x 11<1 


Choisissons ensuite un vecteur z, quelconque d’après (82.2) et 
construisons le vecteur 


Je Tan 
Il vient 
1 1 
l Ayel= ET | A%|l2>77 Ale Nzl=AIN—E. 
Puisque || y, || = 1, on a 
sup || Az ||>|| Ag] >| À | —e. 
EAIES 
£ étant arbitraire, on obtient / 
sup || Az || >|] À ||. (82.6) 
x 11<1 


À présent, (82.5), (82.6) conduisent à la relation (82.3) qu'il fallait 
établir. . 

Nous allons montrer bientôt que la norme d'un opérateur joue 
un rôle exceptionnel pour l'introduction d’une métrique dans les espaces 
des opérateurs linéaires. C'est précisément la forme explicite (82.3) 
qui y sera essentielle. 


Exercices 


1. Montrer que sur l’ensemble fermé borné des vecteurs les bornes infé- 
rieure et supérieure des normes des valeurs d’un opérateur linéaire se réalisent. 

2. Montrer qu'un opérateur linéaire transforme tout ensemble fermé borné 
en un ensemble fermé borné. 


3. La proposition de l'exercice précédent est-elle vraie si elle n'impose 
pas à l’ensemble la condition d'être borné? 

4. Montrer que dans la formule (83.3) la borne supérieure se réalise sur 
l'ensemble des vecteurs qui ne vérifient la condition || z || — 1 que si dim X > 0. 

5. Soit À un opérateur dans un espace X. Montrer que À est non dégénéré 
ai, et seulement si, il existe un nombre m > 0 tel que | Az | > m || z || pour 
tout zx € X. 


$ 83. Norme d’un opérateur 


L'ensemble w+x-7 des opérateurs linéaires de À dans Ÿ est un 
espace vectoriel de dimension finie. Si cet espace est réel ou com- 
plexe, on peut le transformer en un espace métrique complet en le 
munissant d'une norme. 

L'introduction d'une norme dans un espace des opérateurs 
linéaires se fait de même que dans tout autre espace vectoriel. 


18—01090 
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Pourtant, dans ce cas, l’intérêt porte surtout sur les normes dans 
ox dont la liaison avec les normes des espaces X, Ÿ est assez étroite. 
Parmi les classes les plus importantes de telles normes il y a celle 
des normes dites concordantes. 

Si pour chaque opérateur de wx7 on vérifie l'inégalité 


Az << 14 Hz 


pour tout x € X, la norme des opérateurs s'appelle concordante 
avec les normes vectorielles dans les espaces X, Y. 

L'avantage que présentent les normes concordantes est rendu 
évident par l’exemple suivant. Supposons que À soit une valeur 
propre d'un opérateur À dans un espace X, z un vecteur propre qui 
lui correspond. Alors, Az = Àx, donc 


[A T-z = Az = 142 1< A 1-Nz 1. 


Par conséquent, | À | < || À ||. Ainsi, nous avons abouti à une 
conclusion importante: 

Les modules des valeurs propres d’un opérateur linéaire ne dépassent 
aucune de ses normes concordantes. 

Cet exemple montre que pour obtenir les meilleures évaluations 
il faudrait utiliser la plus petite des normes concordantes. Il est 
clair que toutes les normes concordantes sont bornées inférieurement 
par l’expression (82.3). Si nous montrerons que cette expression 
satisfait aux axiomes d’une norme, ce sera alors la plus petite des 
normes concordantes. Nous allons justifier par là même le nom de 
l'expression (82.3) ainsi que sa notation. 

Pour tout opérateur À, l’expression || À || est évidemment non 


négative. Si || À || = 0, c’est-à-dire si 
sup || Az||=0, 
I x l<1 
alors || Az || = 0 pour tout vecteur z à norme au plus égale à l’unité. 


Mais dans ce cas, l'opérateur étant linéaire, Az = 0 pour tout x. 
Par conséquent, À = 0. Pour un opérateur À quel qu’il soit et un 
nombre À, on a 


IAAI= sup |[A4z|]=|A| sup || Az||=]A|°|| À ||. 
I x 11<1 I x 11<1 


Et, enfin, pour deux opérateurs quelconques À, B de wxy 
NA+B1l= sup || Az+Bz||< sup (|| Az] +|| Bz||) << 
x ll<1 x 11<1 


< sup || Az|l+ sup || Bzl=|| A+ BI. 
NM x 1I<1 [ETES 


Toutes ces relations signifient précisément que l'expression (82.3) 
est une norme dans l’espace des opérateurs linéaires. La norme (82.3) 
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s’appelle norme d’un opérateur subordonnée aux normes vectorielles 
dans les espaces X, Y. 

La norme subordonnée jouit d’une propriété très importante par 
rapport à la multiplication des opérateurs. Soient À un opérateur 
de À dans YŸ, B un opérateur de Ÿ dans Z. On sait alors que l’opé- 


rateur BA est défini. En tenant compte de la concordance des normes 
subordonnées on trouve 


I BA||= sup |I(BA)z|| sup || B(Az)||< 
zx 1i<1 Ixli<1 
< sup (| BIl-| Az) = BI sup | 4z = 21-11 À ||. 
Ixll<1 I x <1 


Ainsi, toute norme subordonnée d’un opérateur jouit des quatre 
propriétés principales suivantes. Pour n'importe quels opérateurs 
A, B et tout nombre À, on a 
IAÏ>0, si 40; |[01|=0, 

IAAI=IALIA 83.1 
IH A+BII<I A+ 1 BH, | 
4. | BA <|I B1-I A1: 


Une propriété supplémentaire consiste pour l’opérateur identique E 
à véfifier l'égalité 
9. IL E || = 1. 


Elle résulte de (82.3), étant donné que Ex = x pour tout vecteur x. 

Dans le cas général, une norme subordonnée d’un opérateur 
dépend tant de la norme dans l’espace À que de la norme dans l’espa- 
ce Ÿ. Si les deux espaces sont unitaires, on peut y choisir comme 
norme la longueur des vecteurs. La norme subordonnée correspon- 
dante de l’opérateur s'appelle norme spectrale notée ||-|l.:. Ainsi, 
pour tout opérateur À de X dans Y 


|A] — sup (Az, Az). (83.2) 
(x, x)<1 


oo I 


Etudions certaines propriétés de la norme spectrale. 

La norme spectrale d'un opérateur ne change pas si on multiplie 
ce dernier par les opérateurs unitaires. 

Soient V, U des opérateurs unitaires arbitraires qui agissent 


respectivement dans les espaces X, Ÿ. Considérons l'opérateur 
B = UAV. On a 


| BI = ob (Bz, Bz) — ne (UAVz, UAVz) — 


(x, x)<1 
= . (AVz, PAIE ga (AVz, AVz) = 
(x, x)<1 (x, æz)< <1 
= sup (AVz, AVr)= sup (Av, Av)—|| À ||. 
(Vx, Vx)<i (D, v)<1 
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La donnée d’une norme spectrale sous la forme (83.2) permet 
d'établir sa liaison avec les nombres singuliers de l'opérateur À. 


Soient Zy, Zsy + : > Tm Un Système orthonormé de vecteurs propres 
de l'opérateur A*A et p°, p£, . .., ph ses valeurs propres. Supposons 
sans restreindre la généralité que 
h>Pr> -.. >Pm >0. (83.3) 
Mettons le vecteur x € X sous la forme 
TZ = Œty + ... + Amlm: (83.4) 
alors, 
m 
\] 
(x, x) = 2 | œi 
i=1 
Comme nous l’avons noté au $ 78, l’opérateur À transforme le systè- 
ME Ty, Toy + + +» Im EN Un système orthogonal; en outre 


(Az:, Ax;) = pi 
pour tout i. Donc 


m 
(42, 47)= Xl œfpt, 
ce qui conduit à 


IAÏË= sup  XlaPot. (83.5) 


m 
D la; l2<1 
i=1 


Il est clair qu’à la condition (83.3) 
Il A1 <oi- 


Or, pour le vecteur x, le second membre de (83.5) prend la valeur pi. 
Pour cette raison 

Il À 15 = PS. 
Ainsi, 

La norme spectrale d’un opérateur À est égale à son nombre singulier 
maximal. 

Rappelons que, pour un opérateur normal À, les nombres singu- 
liers coïincident avec les modules des valeurs propres. Par consé- 
quent, la norme spectrale d’un opérateur unitaire est égale à l’unité, 
la norme spectrale d'un opérateur non négatif est égale à la valeur 
propre maximale. 
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Exercices 
1. Montrer que toute valeur propre À d’un opérateur À vérifie l'inégalité 


FA] <inf 1} A* 11/8. 
R 


2. Soit o (=) un polynôme quelconque à coefficients non négatifs. Montrer 
que 
lp (A4) 1< CHA 1). 


3. Montrer que, pour tout opérateur non dégénéré 4, || À | > || À”? |-1. 
Quand l'égalité a-t-elle lieu dans le cas de norme spectrale? 


$S 84. Normes matricielles d’un opérateur 


La norme spectrale est au fond l'unique norme subordonnée 
d’un opérateur, dont le calcul n’est pas lié aux bases d’une façon 
explicite. Mais si dans des espaces où agissent des opérateurs on 
fixe des bases quelconques, les possibilités d'introduire des normes 
opératorielles deviennent sensiblement plus larges. 

Revenons donc aux opérateurs linéaires d'un espace X dans un 


espace Ÿ. Supposons qu'on ait fixé dans X une base e,, e,, . .., Em; 
dans Ÿ une base q,, g:, . .., 4: En décomposant un vecteur arbi- 
traire z E À suivant la base, on obtient 

Lire + 2: + tpes. (84.1) 


Maintenant une norme dans l’espace X peut être introduite à l’aide 
des coefficients de la décomposition (84.1), par exemple, d’après 
la formule (52.3). D'une façon analogue on peut introduire une 
norme dans l’espace Y. 

Les normes les plus usitées sont celles de la forme (52.4). C’est 
pourquoi nous allons étudier les normes d’opérateurs subordonnées 
et concordantes précisément avec ces normes. Bien plus, nous allons 
adopter que les deux espaces X et Y sont munis de normes de même 
type. ÏIl est manifeste que les normes correspondantes d’un opéra- 
teur À doivent être liées de quelque manière aux éléments a,; de 
sa matrice dans les bases choisies. 

_ Etablissons d’abord les expressions pour les normes d'opérateurs 
subordonnées aux 1-normes et aux o-normes de (52.4). On a 


NAlk= sup lL4zlk= sun (BIS exl)< 


[1S1 i=1 


< sup (> lee SA re al D laul)< 


Ix li i=17=1 


<(max, À Laul)( sup |1z1h)= max au. 


1<j<m i 
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Montrons maintenant que pour un certain vecteur z qui vérifie 
la condition || z | < 1, la norme || Az |, coïncide avec le second 
membre de la relation obtenue. 

Supposons que la valeur maximale du second membre se réalise 


pour ÿ = l. Alors, pour z = e;, par exemple, toutes les inégalités 
deviennent égalités. Ainsi, 


n 
I Alh= max D lai;l. 
1<I<m i=1 


D'une façon analogue, on analyse l’autre norme: 


MAle= sup. | Alle SUP ( max | À ayt;|) < 


x [lo xl <i 1<i<r 


<, sup ( max À laut 1#D< 


xl St 1SiSn 51 


< sup (( max À lau|) (max |z;|)) = 
Hxlo<S1 1SiSn j= 1<i<m 


=( max leu) ( sup lIzlls)= max 2 laul. 


1<i<n j=1 xl <1 1<i<n 


œo = 


Supposons que la valeur maximale du second membre se réalise 
pour à — /. Prenons le vecteur z aux coordonnées x; = | ay; l/auj, 
si ay; 0 et z; = 1, si ay; — 0. On vérifie sans peine que pour ce 
vecteur toutes les inégalités deviennent égalités. Par conséquent, 


I 4 [lo = max À laut. 
1<i<n j3=1 
Pour calculer la norme d'un opérateur subordonnée aux 2-normes 
de (52.4) procédons comme suit. Munissons les espaces X, Ÿ de 
produit scalaire par analogie avec (32.1). Alors, la 2-norme de (52.4) 
coïncidera avec la longueur du vecteur. C’est pourquoi la norme 
subordonnée n’est rien d'autre que la norme spectrale associée au 
produit scalaire donné. Les produits scalaires étant choisis, les 
bases deviennent orthonormées: il s'ensuit que dans ces bases à 
l'opérateur adjoint correspond la matrice adjointe. Si on désigne 
par À. la matrice de l’opérateur À, ce qui est dit plus haut entraîne 
que 
La norme d’un opérateur À subordonnée aux 2-normes est égale au 
nombre singulier maximal de la matrice A. 
Les normes concernées sont des fonctions de la matrice d’opéra- 
teur. D'une façon analogue, on peut construire non seulement des 
normes subordonnées, mais encore des normes concordantes. L'une 
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des normes concordantes parmi les plus importantes est ce qu’on 
appelle la norme euclidienne, notée ||-||2. Si dans les bases retenues 
la matrice de l'opérateur À est À aux éléments a;;, alors par 
définition 


lAls=(D Dep). 
i=1 )=1 


Le second membre de cette expression est la norme dans l’espace 
de dimension nr X m des opérateurs linéaires. C’est pourquoi l’ob- 
servation des premières trois propriétés (83.1) ne se met pas en 
doute. Le fait qu’une norme euclidienne satisfait également à la 
quatrième propriété de (83.1) est très important. Pour le démontrer 
utilisons l'inégalité de Cauchy-Bouniakovski de la forme (27.5). 

Considérons les espaces vectoriels X, Ÿ, Z de dimensions res- 
pectives m, r, p. Soient À un opérateur de X dans Ÿ, B un opéra- 
teur de Ÿ dans Z. Désignons par a;,, b;; les éléments des matrices 
de ces opérateurs dans les bases choisies. On a 


I 84 lle= ( à] È bar; |)" < 
(ED CE léu leu) < 


= 
1 R=1 
P 

<(> 


M3 


% 
l 


ñn 


CE 164 P)CS Lau F)"*= 


= 1 


À | bux PS È ja)" = Biel À Île 


M3 


CS 


| 
PS, 
Er à 
î Ib Ÿ' 


Dans le cas général une norme euclidienne n'est pas une norme 
subordonnée. Pour démontrer qu'elle concorde avec les 2-normes 
on procède de la même façon que pour la propriété qui vient d'être 
démontrée. 

La vérification directe permet d'obtenir des formules importantes 
d'une norme euclidienne: 


Il À Île = tr (Age Age) = tr (AgeAge) . (84.2) 


Maintenant nous pouvons tirer les conclusions suivantes. 

Dans des bases orthonormées, à la matrice adjointe correspond 
l'opérateur adjoint. Pour rendre orthonormées les bases choisies, 
par analogie avec (32.1) nous munissons les espaces X, Ÿ des produits 
scalaires. Etant donné que la trace d’une matrice est égale à la 
somme de ses valeurs propres, (84.2) entraîne que 


280 PROPRIETES METRIQUES D'UN OP£RATEUR [CH. 10 


Le carré d’une norme euclidienne d'un opérateur est égal à la somme 
des carrés de ses nombres singuliers. 

Si À, Ÿ sont munis de produits scalaires, on peut parler des 
opérateurs unitaires. On montre sans peine que 

La multiplication d'un opérateur par les opérateurs unitaires ne 
change pas sa norme euclidienne. 

En effet, comme nous l’avons constaté dans les exercices du $ 78, 
la multiplication par les opérateurs unitaires ne change pas les 
nombres singuliers; or, c’est seulement par les nombres singuliers 
que s'exprime une norme euclidienne. 

Dans la plupart des applications des normes, ce n’est pas tant 
la donnée explicite d'une norme d’opérateur qui importe, que ses 
propriétés (83.1). Il en résulte qu’une norme d’opérateur peut être 
définie axiomatiquement à l’aide de sa matrice. Choisissons des 
bases quelconques dans les espaces où sont donnés les opérateurs ; 
à chaque opérateur correspond alors une certaine matrice. Associons 
à chaque matrice un nombre noté ||-|| et supposons qu'on respecte 
les conditions (83.1) comme axiomes. Appelons le nombre ||-{| 
norme d'une matrice. Si à présent à chaque opérateur nous associons 
la norme de sa matrice, il est clair que par là même nous munissons 
d’une norme l’espace des opérateurs. Il est évident que les condi- 
tions (83.1) ont également lieu pour les opérateurs. La réciproque 
est vraie elle aussi. Toute norme d'opérateurs engendre dans les 
bases fixes une norme de matrice. Pour noter ces normes de matrices 
nous utiliserons des symboles analogues {l-|L, [|-[L, etc. 11 est 
clair que nous pouvons aussi exiger axiomatiquement que la norme 
soit concordante. 

Les exemples passés en revue montrent qu'il est pratiquement 
possible de donner axiomatiquement une norme d'opérateur à l’aide 
d’une norme de matrice. Dans ce qui suit, en parlant des normes 
de matrice et d’opérateur nous supposerons toujours leur concordance 
et l'observation des conditions (83.1). 


Exercices 


1. Montrer que quelle que soit la norme, la matrice unité vérifie l’inégalité 


IE 1 > 1. (84.3) 
2. Soient À, .-.., À les valeurs propres d’une matrice A. Montrer que 
de 
inf|| B-tAB|le= D} | An (2. 
B k=1 


Comparer cette égalité à (81.1). 
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$ 85. Equations opératorielles 


L'un des plus importants problèmes de l’algèbre est celui des 
systèmes d'équations linéaires algébriques. Dans notre cours, nous 
avons déjà examiné ce problème à maintes reprises. Considérons-le 
maintenant du point de vue de la théorie des opérateurs linéaires. 

Soit un système (60.2) aux éléments du corps P des nombres 
réels ou complexes. Choisissons un espace X quelconque de dimen- 
sion m et un espace Ÿ de dimension » sur le même corps LP et fixons 
dans ces espaces des bases quelconques. Les équations (60.2) seront 
alors équivalentes à une égalité matricielle de la forme (61.2) qui, 
à son tour, sera équivalente à l'égalité opératorielle 


AT = y. (85.1) 


Ici À est un opérateur de X dans Ÿ qui possède dans les bases rete- 
nues la même matrice que le système (60.2). Les coordonnées des 
vecteurs z € X et y € Ÿ dans les bases choisies sont respectivement 
(Eis 2223 6) et (0 3 0): | 

Ainsi, au lieu d'un système d'équations linéaires algébriques, 
nous pouvons examiner une équation (85.1). Le problème consiste 
à déterminer tous les vecteurs zx € À qui, l'opérateur À et le vecteur 
y E Ÿ étant donnés, vérifient (85.1). L'équation de la forme (85.1) 
s'appelle équation opératorielle, le vecteur y est dit second membre 
et le vecteur zx solution. Toutes les propriétés des systèmes d'équations 
trouvent évidemment leurs homologues pour les équations opéra- 
torielles et inversement. 

Le théorème de Kronecker-Capelli formule la condition nécessaire 
et suffisante de la compatibilité d'un système dans le langage de 
rang de matrices. Ceci n’est pas très commode parce que ce théorè- 
me ne rend pas évidente la liaison profonde entre les systèmes et les 
équations d’autres types. 

Supposons que les espaces X, Ÿ soient unitaires, l'opérateur A* 
est alors défini. Appelons l’équation (85.1) équation inhomogene 
principale, l'équation 


Au = v, 


équation inhomogène adjointe. Si les seconds membres sont nuls, les 
équations correspondantes sont dites homogènes. La proposition 
suivante est vraie: 

Ou bien l'équation inhomogène principale possède une solution 
quel que soit le second membre, ou bien l'équation homogène adjointe 
possède au moins une solution non nulle. 

En effet, désignons par r le rang de l’opérateur À. Le rang de 
l'opérateur A* est r lui aussi. Deux cas peuvent alors se présenter : 
ou bien r = nr, ou bien r << n. Dans le premier cas, la dimension 
du domaine des valeurs de À est n, ce domaine coïncide donc avec 


282 PROPRIETES M£TRIQUES D'UN OPERATEUR [CH. 10 


l'espace Y. C'est pourquoi l'équation inhomogène principale doit 
avoir une solution quél que soit le second membre. Dans notre cas, 
le défaut de l’opérateur adjoint est nul; le noyau ne possède donc 
pas de vecteurs non nuls, c'est-à-dire l'équation homogène adjointe 
ne possède pas de solutions non nulles. Si r << n, le domaine des 
valeurs de l’opérateur À ne coïncide pas avec Ÿ , et l'équation inho- 
mogène principale n’a pas de solution pour certains seconds mem- 
bres. En outre, le noyau de l'opérateur adjoint se compose non 
seulement de vecteur nul; par suite, l'équation homogène adjointe 
possède nécessairement des solutions non nulles. 

L'intérêt de la proposition démontrée est grand surtout pour 
les espaces À, Ÿ qui se confondent. A présent l’existence d’une 
solution de l’équation inhomogène principale, quel que soit le 
second membre, témoigne du fait que l'opérateur À est non dégé- 
néré. Il en résulte ce qu’on appelle 

Alternative de Fredholm. Ou bien l'équation 
inhomogène principale possède une solution et une seule quel que soit 
le second membre, ou bien l'équation homogène adjointe possède au 
moins une solution non nulle. 

Théorème de Fredholm. Pour que l'équation inho- 
mogène principale soit résoluble, il faut et il suffit que son second 
membre soit orthogonal à toutes les solutions de l'équation homogène 
adjointe. 

Démonstration. Désignons par N* le noyau de l'opé- 
rateur A*, par 7 le domaine des valeurs de l’opérateur À. Si l’équa- 
tion inhomogène principale est résoluble, on a y € T. D'après (75.8), 
il s'ensuit que y L N*, c'est-à-dire (y, u) —0 pour tout vecteur u 
-vérifiant l'équation A*u — 0. Soit maintenant (y, u) — O pour les 
mêmes vecteurs u, alors y L N* et, d’après (75.8), y € ZT. Or, cela 
signifie qu'il existe un vecteur x € À tel que Ar = y, c'est-à-dire 
que l'équation inhomogène principale est résoluble. 


Exercices 


1. Montrer que l'équation A*Az — A*y est résoluble. 

2. Montrer que l'équation (4*A)Pz — (A*A)3y est résoluble quels que 
soient p, q entiers positifs. 

3. Donner une interprétation géométrique de l'alternative et du théorème 
de Fredholm. 


S 86. Pseudo-solutions et opérateur pseudo-inverse 


La donnée arbitraire d’un opérateur À et d’un second membre y 
peut amener à une équation (85.1) ne possédant aucune solution. 
La situation peut changer si l’on modifie la notion de solution d'une 
équation. 
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Considérons un vecteur arbitraire x € X et examinons le vecteur 
r = Az — y appelé résidu du vecteur zx. Pour que z soit solution 
de l'équation (85.1), il faut et il suffit que son résidu s'annule. À son 
tour, pour qu'un résidu s’annule, il faut et il suffit que sa longueur 
soit nulle. Aïnsi, toutes les solutions de l'équation (85.1) et elles 
seules vérifient l'égalité | 


| Az — y | = 0. 


Si l'équation (85.1) possède des solutions, la valeur nulle de la 
longueur du résidu est sa valeur minimale. La résolution de l'équa- 
tion (85.1). peutiêtre alors envisagée comme la recherche des vecteurs z 
tels que l’expression 


Dix) = | 4z — y (86.1) 


soit minimisée. Le second membre de cette expression s'appelle 
fonctionnelle du résidu. Le calcul des vecteurs qui minimisent la 
fonctionnelle du résidu a un sens également dans le cas où l’équa- 
tion (85.1) ne possède pas de solutions. Ceci justifie la définition 
suivante : 

On appelle pseudo-solution (ou solution généralisée) de l’équa- 
tion (85.1) tout vecteur x € X tel que la fonctionnelle du résidu 
soit minimisée. Une pseudo-solution de la plus petite longueur est 
dite normale. 

Montrons qu’une pseudo-solution normale existe toujours et 
qu’elle est unique. Fixons dans les espaces X, Y des bases singu- 


lières respectives Zi, . - ., Tm @t Yis + + <» Yn. SOit 
. . 
T— à ŒRThs Y— 2 Bpyp- (86.2) 


En tenant compte des relations (78.2), on trouve que 
m p 
Az—y= à PGaUx — 21 Bpÿp- 


Admettons comme auparavant que les nombres singuliers ps, . . ., D: 
sont différents de zéro, alors que les autres sont nuls. Les bases 
singulières étant orthonormées, il vient 
t n 
9 ! \ Lu 
D(z)= D | Pat —Ba + 2 |Bpl. 
R-=1 p=t+1i 

Il est évident que la plus petite valeur de la fonctionnelle du résidu 
s'obtient sur ceux des vecteurs z, y dont les dernières m — { coor- 
données &, sont arbitraires, alors que les premières { coordonnées 
sont définies par la formule 


ar — Pa/Pa. (86.3) 
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La pseudo-solution normale s'écrit donc 


t 
… Br 
Lo = > Pr 7* (86.4) 
k=1 
Rappelons que les vecteurs z;44, . . ., Tm forment une base du 


noyau de l’opérateur À. C’est pourquoi l’ensemble de toutes les 
pseudo-solutions est un plan de l’espace X, dont le sous-espace 
directeur coïncide avec le noyau #, alors que le vecteur de transla- 
tion coïncide avec n’importe quelle pseudo-solution. La pseudo-solu- 
tion normale est l'unique vecteur de ce plan orthogonal à N. 

En utilisant les relations (78.2), (78.3), on montre aisément 
que les pseudo-solutions et elles seules vérifient l'équation 


A*Az = A*y. (86.5) 


En effet, écrivons les vecteurs z, y sous la forme des décomposi- 
tions (86.2). On a 


t t 

A*Az = 2 PÈauTr, A = 2 Prht- 
Il en résulte que les solutions des équations (86.5) sont ceux et seule- 
ment ceux des vecteurs x, dont les premières { coordonnées a; se 
calculent d’après (86.3), et les m — t dernières coordonnées sont 
arbitraires. 

Ainsi, si la résolubilité de l'équation (85.1) n'est pas garantie, 
nous pouvons toujours remplacer sa résolution par celle de l’équa- 
tion (86.5) en assurant ainsi la minimisation de la fonctionnelle du 
résidu de l'équation (85.1). 

Le rôle que joue l’opérateur inverse est essentiel dans de nom- 
breuses recherches. Nous ne l’avons défini pourtant que pour un 
opérateur non dégénéré, et pour le moment nous ne possédons pas 
d'analogue pour un opérateur dégénéré et un opérateur qui agit 
d’un espace dans un autre. Un tel analogue peut se construire à 
partir des pseudo-solutions. 

Soit À un opérateur d’un espace X dans un espace Ÿ . A chaque 
vecteur y € Ÿ nous pouvons associer alors le vecteur unique x, € À, 
pseudo-solution normale de l'équation (85.1). Cette correspondance 
définit un opérateur À* de Ÿ dans X qui s'appelle opérateur pseudo- 
inverse (ou inverse généralisé) par rapport à l'opérateur À. Ainsi, 
par définition, 

Zo = A*y (86.6) 


pour tout y € Ÿ. Il est clair que si l'opérateur À est non dégénéré, 
son opérateur pseudo-inverse coïncide avec son opérateur inverse. Exami- 
nons les propriétés de l'opérateur pseudo-inverse. 
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Supposons que pour un certain vecteur v € Ÿ on ait, en plus de 
(86.6), u, — A‘v. Considérons le vecteur ay + Bv, les nombres a, B 
étant quelconques. Si nous le prenons comme second membre 
de (85.1), le vecteur ax, + Bu, vérifie l'équation correspondante 
de la forme (86.5) et, de ce fait, représente une pseudo-solution. 
Puisque zo, u, sont orthogonaux au noyau de l'opérateur À, le 
vecteur axzo + Bu, est également orthogonal au noyau. Par con- 
séquent, il constitue une pseudo-solution normale. On a établi ainsi 
la linéarité de l'opérateur pseudo-inverse. 

Les propriétés d’un opérateur pseudo-inverse sont aisément 
mises en évidence si l’on examine son action sur les vecteurs des 
bases singulières. D'après (86.4), on a 


A°yr = Pran EE, 


0. k>t. (86.7) 


On en tire que 

Le domaine de définition, le noyau et le domaine des valeurs de 
l'opérateur pseudo-inverse et de l'opérateur adjoint coïncident respecti- 
vement. 

Les formules. (78.2), (78.3), (86.7) permettent d'obtenir des rela- 
tions différentes qui associent les opérateurs À, A4*, A*. Voici 
certaines d'entre elles: 


4. (A*°)* = (4*)", 

2:. (A*)° —=A, 

3. (4A4*)*=A4A*, (44*)}?= AA*, 

4. (A*A)*= À*A, (4*A)°= À*A, 

9. AA*A = À. 
Ces relations se démontrent d’après un seul et même schéma; aussi, 
nous n’examinerons en détail que la première et la troisième rela- 
tions. 


En comparant (78.2) et (86.7) choisissons pour opérateur À son 
adjoint A*. Puisque cet opérateur donne lieu à (78.3), il vient 


s\+ = Px y, k < L, | 
(4°) n= | 0, k>t. 
À présent, en partant de (86.7), appliquons une relation analogue 
à (78.3) à l'opérateur (A*)*. On a 
PRYR k<, 
A* $ — 
x { 0, k>œt. 


Ainsi, les opérateurs (4*)+ et (4*)* coïncident sur la base z,, ... 
- +) Tm» AONC, ils sont égaux. 
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En tenant compte de (78.2), (86.7), on déduit que l'opérateur 44* 
vérifie les relations 


Leyr, k<, 
AA*y, = 86.8 
Yr 0, k>t. ( ) 
Cela signifie que l'opérateur AA* possède un système orthonormé 
de vecteurs propres y, . .- ., yA et les valeurs propres réelles 1 et 0, 


c’est-à-dire qu’il est un opérateur hermitien. Nous avons démontré 
par là la première des relations du troisième groupe. La deuxième 
rélation résulte d’une façon évidente de (86.8). 


Exercices 


1. L'opérateur pseudo-inverse pour l'opérateur nul que représente-t-il? 

2. Soient X, Y deux espaces distincts. Ecrire la matrice d'un opérateur 
pseudo-inverse dans des bases singulières et la comparer à (78.4). 

3. Soient U, V des opérateurs unitaires dans X et Y respectivement. Mon- 
trer que . 


(VAU)* — U*A*+ +. 
4. Montrer qu'il existe des opérateurs À dans X et L dans Y tels que 
At= KA* = A*L. 


Décrire le comportement des opérateurs X, L. 


5. Montrer que l'opérateur pseudo-inverse est bien défini par les condi- 
tions 


AA*A = À, At = KA* = A°L. 
6. Prouver que toutes les pseudo-solutions et elles seules sont des solu- 
tions de l'équation 
Az = AA*y. 


7. Etablir une interprétation géométrique des pseudo-solutions. 


$S 87. Perturbation 
et non-dégénérescence d’un opérateur 


Nous avons insisté à maintes reprises sur le fait qu’une faible 
variation d’une base, des coordonnées d’un vecteur, des éléments 
d’une matrice, etc., peut modifier de nombreuses propriétés liées 
à la notion de dépendance linéaire. Cette notion joue un rôle décisif 
dans toute la théorie des opérateurs linéaires, il est donc très impor- 
tant d'étudier comment influe une faible variation des opérateurs 
eux-mêmes sur leurs propriétés. 

Pour résoudre les problèmes les plus divers, on utilise souvent 
comme moyen auxiliaire un opérateur proche de l'opérateur iden- 
tique. Nous allons donner ce nom à un opérateur qui agit dans un 
espace X et qui est de la forme E + À, où || À || << 1 pour l'une 
quelconque des normes. 
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Si À est une valeur propre de l'opérateur À, alors 1 + À est 
une valeur propre de l'opérateur Æ + 4. Etant donné que |A] << 
< || À ||, en vertu de la condition || À || << 1, toutes les valeurs 
propres de l'opérateur À sont inférieures à l'unité en module. Par 
conséquent, toutes les valeurs propres de l’opérateur Æ£ -+ À sont 
différentes de zéro et cet opérateur est un opérateur non dégénéré. 

Ainsi si la condition || À || 1 est respectée, on a l’opérateur 
(E + A)7! Mais si l'opérateur E + À est dégénéré, alors pour toute 
norme || À || > 1. 


Tout nombre «a inférieur à l’unité en module vérifie la relation 
limite 


(+ a)1= lim @,, 
po 


P 
A 
œp= À (—a). 
k==0 


Montrons qu'une relation analogue a lieu également pour l’opéra- 
teur (£ + 4)71, si || À [| << 1. Examinons la suite {A,} des opéra- 
teurs 


Ap= > (— 4). 
h—0 
On vérifie sans peine que 
(E+ 4)4p=E—(— A)", 
donc 
ICE + 4) 4, —E = 11 API. (87.1) 


Formellement, cette égalité est vraie aussi pour p = —1, si l’on 
pose ÀA_, — 0. On a ensuite 


ICE +4) Ap—El|=1(A4p—(E + 4) +4 (49—(E+4)1)112 
>| Ap—(E+ 4) {ll —| AI: 4) —(E+ A) 1|= 
= (1-1 AN)147—(E + A)". 


À présent, en tenant compte de (87.1), on obtient pour p — —1 
une estimation de la norme de l’opérateur (E + A)-1: 


I E || 
II (E + A)" << AT : 


Toute norme subordonnée donne lieu à l’égalité || E || = 1; il 
s'ensuit que 


ME+A NIET (87.2) 
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Pour p > 0, on obtient une estimation de l'écart entre les opéra- 
teurs À, et (E +- 4A)-!. Plus précisément 
-1 IL À 1[P*4 

| À4p — (E + À) l<4=yaT: 
Vu la condition || À || << 1, cela signifie que la suite {A,} converge 
vers l'opérateur (E + 4)-!. Si l’on considère que l'opérateur À, 
est une approximation de l’opérateur (E + A)-!, la formule (87.3) 
donne une estimation de la précision de l’approximation. 

Soit À un opérateur non dégénéré quelconque. Considérons 
l'opérateur À + £&,, où €, est un opérateur arbitraire. Appelons €, 
perturbation de l'opérateur À, et À + e, opérateur perturbé. Eluci- 
dons dans quelles conditions imposées à la valeur de la norme de la 
perturbation l'opérateur perturbé sera non dégénéré. Nous ne nous 
intéresserons qu’à de petites valeurs de la norme de perturbation. 

L'opérateur À est non dégénéré ; il existe donc un opérateur À-!. 
Par conséquent, on vérifie l'égalité 


A+ea=A(E+A"e,). 


On en tire que l'opérateur À + e, est non dégénéré si et seulement 
si l'opérateur E + A-!e, est non dégénéré. Cette condition est 
remplie si [| A-!e, || << 1 pour une norme quelconque. Elle l’est 
d'autant plus si || A! || [| es || << 1. 
Ainsi, l'opérateur perturbé est non dégénéré pour toute perturba- 
tion qui satisfait à l'inégalité 
eall 1 ASIE (87.4) 


Si la perturbation de l'opérateur À est €,, celle de son inverse À 1 
est (A + e,)7! — A7! Désignons par 
lea || 1 _II(A+ea)"1—471|] = 
SA= page SA Ham (87.5) 
les perturbations relatives des opérateurs À et A”. Si la condi- 
tion (87.4) est remplie, l'opérateur E + Ale, est non dégénéré; 
donc 
(A +ea) !— A1=((A+e,) t A—E) Ai= 
= ((A"t(A+e,)) 1 —E) Af=((E + A'ie,)!—E) A1. 


D'après la formule (87.3), pour p = 0, on trouve que 
> : ATîeA 1-1] 471] Il 47111211 ea || 
A 1 4-11 NA ealN AN NAT IFleal 
(A E4) Tea TA Tea 
Maintenant, en tenant compte de la notation (87.5), on obtient 
l'évaluation suivante 


vAÔA 
1 — V AÔA : 


SA (87.6) 
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* 


ou 
va= || A]: À 1. (87.7) 


Le nombre v, s'appelle nombre de conditionnement de l'opéra- 
teur À. Bien que ce nombre dépend de la norme choisie, il ne peut 
jamais être très petit. En tenant compte de (84.3), on tire de l'égalité 


E = AA 


que 
I ET I AT A = V4. 


La formule (87.6) montre qu’une petite perturbation relative de 
l'opérateur À entraîne une petite perturbation relative de A”! 
seulement dans le cas où le nombre de conditionnement de À n'est 
pas trop grand par rapport à l'unité. Nous retrouverons ce nombre 
dans d’autres problèmes. 

Supposons qu'on résolve l'équation opératorielle 


Az = y (87.8) 

avec un opérateur À non dégénéré. Examinons l'équation perturbée 
(A+E1)T=y+e,. (87.9) 

Si la condition (87.4) est observée, les solutions x et x des équations 
pee (87.9) et exacte (87.8) sont uniques. Evaluons leur dif- 


Introduisons avec (87.5), (87.7) les notations correspondantes 
pour les perturbations relatives dans x, y, c’est-à-dire 


RES E 
él, ôy= TE 
On a 
z=A"ty, z=(A+es) t(y+e). 
D'où 
z—z=((E + Atex)—E) A"ty+(E + A'te4) ! Ate, 
et ensuite 


x 2x1 ICE + A7) —E lez + (E + À"te4) fe Ace, |]. 


19—01090 
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Admettons qu'on utilise une norme subordonnée. En tenant 
compte des estimations (87.2), (87.3), ainsi que de l'inégalité |[|y || < 
< 114 |l-IIz IL, on obtient 


IL A4 11. 1leA 1-1 z || A1 ||-l ep |] 


22 <= + 
el et 7 at 
Iey il 
A1. 4n-lsal A1 AN 
NA 1-1 A1 A DaLeeE PAR 


mn  —— ner ann) Ne 
— 
IA AN A1 A1 AL 


Conformément aux notations adoptées, cela signifie que 
V = 
<< (6 À + ôy). (87.10) 


La formule obtenue montre encore une fois la valeur du nombre 
de conditionnement et là encore il importe du point de vue de la 
stabilité qu'il ne soit pas trop grand. 


Exercices 


1. Montrer que le nombre de conditionnement exprimé en norme spectrale 
est égal au rapport du nombre singulier maximal au nombre singulier minimal. 

2. Il existe des opérateurs dont le nombre de conditionnement est le plus 
petit. Ces opérateurs, que représentent-ils si l’on utilise la norme spectrale? 
8. Montrer qu’en multipliant un opérateur par les opérateurs unitaires 
son nombre de conditionnement exprimé en norme spectrale ou euclidienne ne 
change pas. 

4. Montrer que les opérateurs À, B non dégénérés quels qu'ils soient véri- 
fient l'inégalité 

ILBT1— A°1 | 11 À —B || 
TB SA NAN : 


5. Quelle est la cause de la grande instabilité du système de vecteurs décrit 
au $ 22? Evaluer le nombre de conditionnement de l’opérateur dont les colonnes 
de la matrice coïncident avec les coordonnées des vecteurs (22.7). 


$ 88. Solution stable des équations 


La formule (87.10) montre que pour un opérateur proche d'un 
opérateur dégénéré, la solution peut être sensiblement perturbée même 
dans le cas de faibles perturbations de l'opérateur et du second membre. 
I] peut paraître qu'il en est ainsi parce que la solution elle-même 
n'existe pas toujours. Néanmoins, lorsqu'il s’agit de pseudo-solu- 
tion, la situation est analogue. 
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En effet, soit un opérateur dans un espace bidimensionnel. 
Supposons que, dans une certaine base orthonormée, à l'équation (85.1) 
correspond le système d'équations linéaires algébriques de la forme 


4exzi+O.xz= 1, | 
0. zx, + 0. e Lo — 1: 


On voit facilement que les coordonnées de la pseudo-solution nor- 
male z, sont 


up = (1, 0). 


Il se peut très bien que l'équation perturbée amène dans la même 
base le système 


1x; +O-r:=—1, | 
0x, -L E° To —= 1, 


où, bien que le nombre € soit petit, il est pour autant différent de 
zéro. À présent, les coordonnées de la pseudo-solution normale uf®) 
de l'équation perturbée sont 


u(e) = (1, e”!). 


Pour de petits e, non seulement Îla différence entre les vecteurs w 
et ule) est très grande, mais ils sont même presque orthogonaux. 

Si une équation possède plus d’une pseudo-solution, alors, dans 
le cas général, de faibles perturbations de l’opérateur et du secons 
membre amènent toujours de fortes perturbations de la pseudod 
solution normale. Nous montrerons, toutefois, que malgré l'instabi- 
lité de nombreuses notions relatives aux équations opératorielles, la 
pseudo-solution normale peut être définie d'une façon stable. 

Soit À l'opérateur de X dans Ÿ et on a l'équation (85.1) à ré- 
soudre. Par analogie avec la fonctionnelle du résidu, considérons 
ce qu'on appelle une fonctionnelle régularisatrice 


Dax) =alz + |Axz— y, (88.1) 


où le nombre a > 0. Il est clair que, pour a = 0, cette fonction- 
nelle coïncide avec la fonctionnelle du résidu et atteint son mini- 
mum sur les pseudo-solutions de l’équation (85.1). Elucidons quels 
sont les vecteurs sur lesquels la fonctionnelle régularisatrice est 


minimisée pour a >0. En appliquant la décomposition (86.2), 
on trouve que 


î m n 
Da(z)= 2 (alal+lpau-Bl+a D laP+ 2 |Bpl. 
R=1 p=t+1 


R=t+1 
19% 
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Il s'ensuit que pour atteindre le minimum il faut annuler les der- 
nières COOrdonnées ŒGyt{s + - -» Em €t, pour tout 4 Lt, minimiser 
l'expression 

œ| an [+ | Par — Pa f°, 
ce qui donne pour k <<! 
_PhBn _ 
a+ pi ” 


Ainsi, la valeur d’une fonctionnelle régularisatrice (88.1) est 
minimisée, pour tout «a >> 0, sur le vecteur unique 


= 


=> EL : (88.2) 


La comparaison des (86.4) et (88.2) permet d'établir 
certaines relations qui associent z, et z,. On a pour p, a > 0 


OcIBE_ pIBE _ 1BFe+21BFap 


p2  (a+p p°(a+p} 
_AIBE(S +6) Cruise, 
= p? (œ+p°?)° Rp 


il s'ensuit donc que 
[Ta PLITo PP] Ta + 2an°, (88.3) 


On obtient ensuite 


HR Dr Ph 5° 


d'où l’on déduit que 


| To — Za | K LV: (88.4) 
où 
BE 
D CR 
R=1 


Par conséquent, 
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Ainsi, pour depetites valeurs de a, le vecteur x, peut servir d'approxi- 
mation de la pseudo-solution normale z,. 

Décomposons les vecteurs x, et x, suivant les bases singulières 
d’une façon analogue à (86.2). Une vérification directe montre sans 
peine que z, vérifie l’équation 

(A*A “+ QE) za = A*y. (88.5) 
Pour a > 0, l'opérateur A*A + a£ est défini positif, il existe donc 
l'opérateur (4*A + aE)-!, c’est-à-dire 

Za=(A*A +aE)! A*y. (88.6) 

Sur le vecteur z, la fonctionnelle (88.1) atteint son minimum; 
par conséquent, D, (re) < ®, (zo). En tenant compte de (88.3), 
(88.4), ceci conduit à 

Aru—y PSI Aro y P+ a (170 P— za 
<|A70— y + 2er. (88.7) 
En outre, ®, (re) < ® (0), ce qui entraine 


za |<— LL. 


Avec (88.6) cela traduit le fait que pour & >> 0, pour tout opérateur 
A et tout vecteur y, on a 


|(A*A+@E)"1 À" (88.8) 


Dans les cas pratiques, la donnée de l'opérateur À et du second 
membre y de l’équation (85. 1) est en général inexacte et on est 


obligé de traiter un opérateur À et un second membre y perturbés. 
Si dans les espaces X, Ÿ on utilise comme norme la longueur des 
vecteurs, à cette longueur est subordonnée la norme spectrale des 
opérateurs. Nous supposerons donc que 


1A— Alle, lly—vll<e. (88.9) 


Le calcul d’une solution approchée 7, d’ après À et y perturbés 
conduit à l’équation 
(A*Â+@E) re — A*y. (88.10) 
De (88.5), (88.10) on tire 


(AA HQE) (za— Ta) = A* (Ata—y)— À* (Âte —ÿ) = 
= (4 — À)" (Aza— y) — A" ((Â A) za — (y — y) 
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Cela signifie que la différence x, — x, est une solution de l’équation 
à l'opérateur (Â*A + &E) et à second membre de la forme z — 
= y + ÀA%v, où 
u= (A — À)* (Ata —y), 
v= —((4—À) ze — (y—y)). 
D'où 


Ta — Ta = (A* A+ aE) ty +({ (A A+ aE)"1 Av. 


Evaluons maintenant les normes des deux termes du second membre. 


Les valeurs propres de l'opérateur À*A4 + &£ ne sont pas plus 
petites que &. Par conséquent, les valeurs propres de l’opérateur 


(4*A + &E)-\ ne sont pas supérieures à &æ-!. Pour un opérateur 
défini positif, la norme spectrale coïncide avec la valeur propre 
maximale, c’est-à-dire 

(AA +aE) | <a. 


Si l’on tient compte de (88.7), (88.9), on a 
(AA + &E) tu || || (4*À +aE)"Ilellull< 
a I Aza— y << (1 Azo— y 1124 2a2n?)"/*. 


Pour évaluer ui terme, ei des formules (88.3), 
(88.8), (88.9). On trouve 


IAA + ae) ASE 5 Ga ll sol + Eu) 
Ainsi, 


4 — _— 
Ta — Ze SE (1 Aro — y 1P + 2009) + 5 (a 1 coll + 85) 


L'erreur totale de la pseudo-solution calculée x, s'écrit 
[| To — Za II %o—Za 11 +1 La — La | < 


<av+ 2 (1 Amy If+ 2o2n2) + (allzoll +8). (88.11) 


Le second membre de cette inégalité ne fournit aucune informa- 
tion sur À, y perturbés donnés. C'est pourquoi il existe un & tel que 
le second membre soit minimisé. Cette valeur de & assure presque 


la meilleure approximation par x, de la pseudo-solution normale 
exacte Zo. 
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Supposons que € soit suffisamment petit et que €, et &, soient 
des grandeurs de même ordre de petitesse que e. Si l'équation exacte 
(85.1) possède une solution, alors Az, — y = 0. Dans ee cas, en ce 
qui concerne la dépendance de «& et de e, le second membre de (88.11) 
est une fonction de la forme 


£ 
ARE an: 
œ 


Pour &« = e°/3, l'ordre de sa valeur est e°/5. Mais si l'équation exacte 
ne possède aucune solution, alors Az, — y 0. Le second membre 
de (88.11) est cette fois de la forme 


€ E 
a+a To 


Pour &« = e!”*, l’ordre de sa valeur est e!/*°. 

Ainsi si les données d'entrée de l'équation (85.1) sont fournies à &e 
près, la pseudo-solution normale peut être définie à e°/* près dans le 
cas où l'équation exacte est résoluble, à e!° près dans le cas contraire. 
: Pour calculer la valeur & qui assure l’approximation nécessaire 
z.,-les À et y perturbés ne suffisent pas. Il en est ainsi surtout du 
fait que les conditions (88.9) n’assurent pas la continuité de la pseu- 
do-solution normale dans le domaine donné de la variation de l’opé- 
rateur et du second membre. Pour déterminer «& on utilise d’habitu- 
de une information supplémentaire sur la solution. Dans certains 
problèmes on exige non pas une proximité garantie à la pseudo- 
solution normale, mais seulement la stabilité du calcul du minimum 
de la fonctionnelle de variable de résidu. Dans ces problèmes, la 
détermination du paramètre & est quelque peu plus simple. Malgré 
toute l’importance de ces questions, nous n’allons pas nous y attar- 
der parce qu’elles dépassent le cadre de notre exposé. 


Exercices 


1. Montrer que dans l'estimation (88.3), n est la longueur de la solution 
normale de l'équation 


A*A (A*A)Uer — Ay. 
2. Montrer que, dans l'estimation (88.4), y est la longueur de la solution 
normale de l'équation 
(A*A}°r = A*y. 
3. Prouver que la différence x, — r4 vérifie l'équation 
(494 + @E) (A*A + BE) (ra — 29) = (B — a) A*y. 


4. Comparer (88.11) et (88.10). Que peut-on dire de l'estimation (88.11) 
dans le cas d'un opérateur À non dégénéré? 


do quelle précision peut-on calculer la pseudo-solution normale si 
À = 
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$ 89. Perturbation et valeurs propres 


Dans le cas général, la perturbation d’un opérateur amène à la 
variation de toutes ses valeurs propres et vecteurs propres. L'étude 
de cette dépendance étant très compliquée, nous nous bornerons 
à l'illustrer sur des exemples. Il est plus commode de décrire ce 
problème dans le langage des matrices d'opérateurs et non dans celui 
des opérateurs eux-mêmes. 

Soient B une matrice de structure simple et À une matrice tel- 


le que 
H\BH = \, (89.1) 
où À est la matrice diagonale des valeurs propres À,, À, . - +» Âm- 
Considérons la matrice perturbée B + e, et une de ses valeurs pro- 
pres À. La matrice B + ex; — ÀE est dégénérée, la matrice 
H”1(B+eg—XE) H=(A—RE) + HieH 
est donc dégénérée elle aussi. Deux cas peuvent se présenter: 


1. À—À, pour un certain à, 
2. À—)à; pour tout à. 


Dans le deuxième cas la matrice À — ÀE est non dégénérée; par 
conséquent, 


(AXE) + H-epH=(A—AE)(E+(A—XE): H ep). 


La matrice du deuxième facteur est dégénérée. Cela traduit le fait 
que toute norme de la matrice (A — ÀE)-!H-leLH ne doit pas 
être inférieure à l'unité. En particulier, 


(A — AE)" HieLH | >1. 


Il s'ensuit que 
max | Gui — TI A 2 ll 88 le Ale >1 


1<i< 


ou bien 
min [A—A|<|| A11L||es Île 1 À Île. 
1<i<n 


Cette inégalité s’observe également dans le premier cas, aussi 
a-t-on toujours 


[Ai À] Va || 8 (89.2) 
au moins pour une valeur de àë. Ici 
va= || A ]l2 1 À 


est le nombre de conditionnement de la matrice H exprimé en norme 
spectrale. 
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La relation obtenue signifie que, quelle que soit la perturbation 
e, de la matrice B, pour toute valeur propre À de la matrice pertur- 
bée B + &e, il existe une valeur propre À; de la matrice B telle qu'elle 
donne lieu à l’inégalité (89.2). Constatons que nous n'avons nulle 
part exigé la petitesse de la perturbation e3. La relation (89.2) peut 
être interprétée d’une autre manière: 

Les valeurs propres d'une matrice perturbée sont contenues dans un 
domaine qui est réunion de tous les cercles de centre À; et de rayon 
valleglle. 

Les colonnes de la matrice À sont des vecteurs propres de la 
matrice B. C'est pourquoi (89.2) entraîne que la mesure commune de 
la sensibilité des valeurs propres à la perturbation de la matrice 
peut probablement être fournie par le nombre de conditionnement 
de la matrice H composée de vecteurs propres (et non de la matrice 
B elle-même!). La matrice À qui satisfait à (89.1) n’est pas unique, 
puisque les vecteurs propres sont définis à facteurs arbitraires près. 
Admettons que la matrice H est toujours choisie telle que la valeur 
vx soit minimale. Rappelons que, quel que soit le cas, vx > 1. 

Si B est une matrice normale et, en particulier, hermitienne ou 
unitaire, nous pouvons admettre que la matrice H est unitaire. 
Alors, vx = 1 et 

il] es Île. (89.3) 


Examinons de plus près le cas de la matrice hermitienne B à pertur- 
bation hermitienne e,. Nous pouvons alors démontrer que 

Chaque cercle de centre À; et de rayon ||e,|l, contient au moins une 
valeur propre de la matrice perturbée. 

En effet, considérons par convention la matrice B + €, comme 
matrice «exacte», la matrice B = (B + ex) — £k comme matrice 
« perturbée », la perturbation étant — e,. En reprenant littérale- 
ment tous les calculs, nous obtenons une formule analogue à (89.3), 
mais dans laquelle les valeurs propres des matrices B et B + ex 
changent de rôle. Cela traduit le fait que, pour toute valeur propre 
À; de la matrice « perturbée » B, il existe nécessairement au moins 
une valeur propre À de la matrice « exacte » B + e, telle que l'iné- 
galité (89.3) ait lieu. 

Si les valeurs propres de la matrice B sont simples, alors, la 
perturbation e% étant suffisamment petite, tous les cercles se séparent 
et chaque cercle ne contient qu’une et une seule valeur propre de la 
matrice perturbée. 

La formule (89.3) montre une stabilité notable des valeurs pro- 
pres de matrices normales par rapport à la perturbation. Toutefois, 
dans le problème général de la définition des valeurs propres, ce 
phénomène est plutôt une exception que règle. 

Considérons à titre d'exemple un cas dans un certain sens « li- 
mite », où la matrice B est composée d’une seule cellule canonique 
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de Jordan. On peut convenir que tous les vecteurs propres de cette 
matrice soient colinéaires, que la matrice composée de vecteurs 
propres soit dégénérée et que, par conséquent, son nombre de condi- 
tionnement soit « infini». Ainsi, soit une matrice B de type m: 


ho 1 0 
Ào 1 
À 1 
B=— : . 
0 1 
À 


Son polynôme caractéristique est évidemment (4 — À,)”. 

Choisissons maintenant une matrice de perturbation e4 telle 
qu’un seul de ses éléments, qui est en position (m, 1), soit différent 
de zéro et égal à e. Le polynôme caractéristique de la matrice pertur- 
bée est (À — À,)" — e. Les valeurs propres de la matrice perturbée 
se trouvent donc à la distance | e |" des valeurs propres de la 
matrice exacte. Si, par exemple, m — 20, e — 107! et 7, est de 
l’ordre de l'unité, il ne peut être question d'aucune stabilité pratique. 

Il importe de comprendre que l'instabilité des valeurs propres 
ne soit pas liée nécessairement à la présence des valeurs propres 
multiples et, d'autant plus, à la présence des cellules de Jordan. 
Examinons la matrice B de type 20: 


20 20 0 
19 20 
18 20 
B= : 
2 20 
0 1. 


C'est une matrice triangulaire et c’est pourquoi ses valeurs propres 
sont des éléments diagonaux. À première vue ils sont bien séparés 
et il semble qu'il n’y a aucune raison de s'attendre à une instabi- 
lité. Mais ajoutons une perturbation e à l’élément nul de la position 
(20.1). La variation du terme constant du polynôme caractéristique 
est égale dans ces conditions à 201? e. Le produit des valeurs propres 
étant égal au terme constant, la variation des valeurs propres elles- 
mêmes doit être très forte. 

Des problèmes encore plus compliqués apparaissent lors de l’étu- 
de de la stabilité des vecteurs propres. Il est clair que si une valeur 
propre À d’une matrice B est instable par rapport à une perturba- 
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tion, le vecteur propre z qui lui correspond ne peut être stable, 
puisque B, ?., x sont associés par la relation linéaire Bz = x. 

Il importe pourtant de noter que même si les valeurs propres ne 
changent pas sous l’effet d’une perturbation, les vecteurs propres, 
eux, peuvent non seulement être instables, mais leur nombre même 
peut varier. Par exemple, la première des matrices 


2 O O0: 2 O0 O 
0 1 0 0 4 € 
0 O 1 0 O 1 


compte trois vecteurs propres linéairement indépendants, la deuxièe- 
me deux, bien que leurs valeurs propres sont les mêmes. Théorique- 
ment, ce phénomène n'est dû qu'à la présence des valeurs propres 
multiples de la matrice initiale. Mais si une matrice est donnée ap- 
proximativement, il est difficile, et le plus souvent impossible, de décider 
lesquelles des valeurs propres doivent ètre considérées comme multi- 
ples et lesquelles comme simples. 

Les problèmes relatifs à l'étude des valeurs propres, des vecteurs 
propres et des vecteurs principaux sont les plus compliqués dans les 
branches de l’algèbre concernant le calcul numérique. 


Exercices 


1. Soit B une matrice de structure simple mais possédant des valeurs propres 
multiples. Montrer que, pour tout nombre e > 0 aussi petit que l'on veut, il 
existe une perturbation e vérifiant la condition || eg || < e telle que la ma- 
trice B + ex ne soit déjà plus de structure simple. 

2. Soient B une matrice aux valeurs propres distinctes deux à deux et 
d > 0 la distance minimale entre les valeurs propres. Montrer qu'il existe 
une perturbation e4 vérifiant la condition ji ep |: > d telle que la matrice 
B + ek ne soit pas de structure simple. 

3. Soit maintenant Z une matrice hermitienne. Montrer que si une pertur- 
bation hermitienne e, vérifie la condition ||ep l!s << d/2, la matrice B + e 
possède des valeurs propres distinctes deux à deux. 

4. Soit, enfin, # une matrice non hermitienne qui possède des valeurs 
propres distinctes deux à deux. Montrer qu'il existe un nombre r vérifiant les 
conditions 0 € r < d tel que la matrice B + e, soit de structure simple si et 
seulement si | En le <r. 

5. Essayer d'établir une liaison plus exacte entre les nombres r et d. 
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QUADRIQUES 


$S 90. Formes quadratiques 


Pour résoudre de nombreux problèmes appliqués et théoriques il 
faut souvent faire appel à des fonctions spéciales appelées formes 
quadratiques. Ce sont ces fonctions qui feront l’objet des recherches 
qui suivent. 

On appelle forme quadratique F de m variables réelles x;, x. . .. 
+. ; Im la fonction de la forme 


F= À D aytix,, (90.1) 


où a;; sont des nombres réels. 
Simplifions la notation de la forme quadratique. Examinons 
l'espace euclidien À, dont les éléments sont les vecteurs colonnes 


Tm 
et supposons qu'on ait choisi pour produit scalaire la somme des 
produits deux à deux des coordonnées. Désignons par À la matrice 
composée de coefficients a;; d’une forme quadratique. Sans restrein- 
dre la généralité, admettons que la matrice À est symétrique. On 
peut toujours l'obtenir, par exemple, avec la transformation suivante 
des termes de la forme quadratique 


dij Taj aijTAji 
dijtilj + Ajiliti = —5— Lil) on — Titi. 


I] est clair maintenant que la forme quadratique (90.1) peut s’écrire 
comme produit scalaire 
F = (zx, Az) 


ou 
F = (Az, x). 
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Dans ce qui suit nous utiliserons surtout cette notation-là de la forme 
quadratique. 

Le problème essentiel relatif aux formes quadratiques consiste 
à ramener une forme quadratique à une forme simple au possible à l'ai- 
de d'une transformation linéaire non dégénérée des variables x, 
Lay + + -y Tm en d'autres variables Yis Vos - + «1 Um 

Jl est facile d'établir la loi qui régit la variation de la matrice 
d'une forme quadratique lors du changement de variables. Soit P 
la matrice de changement de coordonnées. Tout vecteur x est alors 
transformé en un vecteur y par la relation 


x = Py: (90.2) 
Mais cela signifie que 
F = (Az, x) = (APy, Py) = (P'APy, y). 
Ainsi, dans une transformation des variables à l’aide de la formu- 


le (90.2), la matrice B de la nouvelle forme quadratique est associée 
à la matrice À par la relation 


B = P'AP. (90.3) 


En choisissant une matrice de transformation P convenable, on 
peut changer le type de la matrice d’une forme quadratique. Pour 
une forme quadratique à matrice diagonale nous dirons forme cano- 
nique. 

On peut admettre que les coefficients d’une forme canonique 
valent l’un des trois nombres 0, —1, +1. En effet, soit 


F= ay? + œys +... + my? 


Supposons pour simplifier que &;, . .., &, soient des coefficients 


positifs, &Œy+1, - . ., @- des coefficients négatifs et &@,+1, . . ., 4m des 
coefficients nuls. En posant 
V'aiv, 1<i<!, 
Zi — — y Yi) l+1<i<r, (90.4) 


Vi, r+1<i<m, 


on obtient que 


F=i+.. + — 2h — ... —2?. 


Il est évident que la transformation (90.4) est non dégénérée 
et réelle. Une forme canonique munie de coefficients O0, —1, +1 est 
appelée forme normale. 

Toute forme quadratique est réduite à la forme canonique à l’aide 
d'un changement de variables à matrice de changement orthogonale. 
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En effet, mettons la matrice symétrique À d’une forme quadra- 
tique F sous la forme 
A = Q'AQ, 


où Q est une matrice orthogonale, A la matrice diagonale des valeurs 
propres. Notons y = Qz; il vient 


F = (4x, x) = (Q'AQz, 2) = (AQz, Qzx) = (Ay, y). 


Si M, Àos - + -» ÀÂm Sont les éléments diagonaux de la matrice À, 
Yys Yos + + +» Um 1eS Coordonnées du vecteur y, alors en calculant le 
produit scalaire (Ay, y) on obtient 


F= y? + oy5 +... + Amy. 


Il existe de nombreux procédés pour ramener une même forme qua- 
dratique à sa forme canonique. La forme canonique n’est donc pas 
définie d’une manière univoque. Une question se pose naturelle- 
ment, à savoir ce qu il y a de commun entre les formes quadratiques 
canoniques différentes auxquelles se réduit une forme quadratique 
donnée F. Comme nous allons le voir, cette question est étroitement 
liée à la condition sous laquelle l’une des deux formes quadratiques 
peut être transformée en l’autre par une transformation linéaire non 
dégénerée des variables. 

La matrice P de (90.3) est non dégénérée, c’est pourquoi les ma- 
trices À et B sont de même rang. Il s'ensuit, en particulier, que, quel 
que soit le mode de réduction à la forme canonique, le nombre de 
termes non nuls de cette dernière ne dépend pas du mode de réduc- 
tion. À présent, chaque forme canonique peut être décrite par le 
nombre de ses termes positifs et négatifs. Pourtant, on vérifie le 

Théorème 90.1 (principe d'inertie des formes quadratiques). 
Le nombre de termes positifs et de termes négatifs d’une forme canoni- 
que ne dépend pas du mode de réduction. 

Démonstration. Soit F une forme quadratique de m 
variables réelles zx;, z:, . . ., Tn réduite par deux procédés à la for- 
me normale 


9 9 9 __ 
F= Yi +yi + HU Us — Vigo ce UE = 
= 2h20 EN RU TE 
= 24 +25 + eee i Z; °1+1 1+2 CHER) 77. (90.5) 
Comme la substitution des variables x;, z:, . . ., Zn par des varia- 
bles y, Ye, + . .; Ym à été réalisée à l’aide d’une transformation li- 
péaire non dégénérée, les deuxièmes variables s'expriment elles aussi 


linéairement par les premières; de plus, le déterminant de la ma- 
trice de la transformation inverse sera différent de zéro. Ainsi 


= bi: ee Dim 
yi= Ÿ bistes aet( ss... | £ 0. (90.6) 
b 


s—= À 
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D'une façon analogue, 
tue C1 CRE Cim 
2j = > CjtTt, et RSR ER | — 0. (90.7) 


Supposons maintenant que k << L et écrivons le système d'égalités 
y =0, ET Yyr = 0, Z141, = 0, see 5 =0, ss Zm= 0. (90.8) 


Si les premiers membres de ces égalités sont remplacés par leurs 
expressions tirées de (90.6), (90.7), nous obtiendrons un système de 
m — L + k équations linéaires homogènes à m inconnues x, z:, . . 

> Im. Le nombre d'équations dans ce système est inférieur au 
nombre d’inconnues et c’est Puel le système possède une solu- 
tion réelle non nulle &;, &, .. 

Remplaçons maintenant dans Tégalité (90.5) toutes les varia- 
bles par leurs expressions tirées de (90.6), (90.7), puis substituons aux 
variables z,, ze, . . ., rm les nombres &;, &», . . ., Œm. Si, pour abré- 
ger l'écriture, on note y; (œ) et z; (&«) les valeurs des variables 
Ys, 25, après une telle substitution et compte tenu de (90.8), la rela- 
tion (90.5) devient égalité: 


—y?,,(a)—...—y2(a)=2?(a)+ ... +722 (x). 
Il en résulte que 


zm(&)=...—72,;(&) = 0. (90.9) 
D'autre part, le choix même des nombres &;, &:+, . . ., 4m donne 
2n(a)=:.::=5(0=:.:=7,(@c)—=0: (90.10) 


Ainsi, le système de m équations linéaires homogènes 
z; = 0, 11,2: m 


à M inCONNUES ZT, Los - + +» Tm Possède, en vertu de (90.9), (90.10), 
une solution non nulle &;, &., . .., Gm, C'est-à-dire le déterminant 
de ce système doit être nul. Ceci est en contradiction avec (90.6). 
On aboutit à une contradiction analogue en supposant que L << k. 
Donc ! = k et le théorème est démontré. 

Le nombre de termes positifs d'une forme canonique s’appelle 
indice d'inertie positif de la forme quadratique, son nombre de 
termes négatifs indice négatif. La différence entre les indices positif 
et négatif est dite signature de la forme quadratique. Le rang de la 
matrice d'une forme quadratique coïncide avec le nombre de termes 
non nuls de sa forme canonique. Ce nombre s'appelle rang de la forme 
quadratique. 

Nous pouvons montrer maintenant que deux formes quadratiques 
de m inconnues peuvent être transformées l’une en l’autre par des 
transformations linéaires non dégénérées si et seulement si les rangs 
de ces formes, ainsi que leurs signatures, sont identiques. 
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En effet, supposons qu’une forme F se transforme en une forme G. 
Nous savons qu'une telle transformation ne change pas le rang de la 
forme. Elle ne change pas non plus sa signature, car, s’il n’en était 
pas ainsi, F et G auraient des formes canoniques distinctes, ce qui 
contredit la loi d'inertie. Mais si les rangs des formes F et G, ainsi 
que leurs signatures, sont identiques, les formes ont une même forme 
canonique et, de ce fait, peuvent être transformées l’une en l’autre. 

Appelons deux formes quadratiques affinement équivalentes si 
elles peuvent être transformées l’une en l’autre par une transforma- 
tion non dégénérée des variables. On vérifie aisément que l’équiva- 
lence affine des formes quadratiques est une relation d'équivalence. 
C'est pourquoi ce qui a été démontré entraîne que toutes les formes 
quadratiques d’un même nombre de variables peuvent être rangées 
dans des classes disjointes et dont chacune ne contient que des for- 
mes affinement équivalentes. Une classe est définie par le rang et la 
signature. Cette division s'appelle classification affine des formes 
quadratiques. 

L'une des classes les plus importantes est celle des formes défi- 
nies positives. Une forme quadratique (Az, x) est dite définie positi- 
ve si (Az, x) > 0 pour tout x 0. Comme nous le savons déjà, 
pour qu'une forme quadratique soit définie positive il faut et il suffit 
que toutes les valeurs propres de sa matrice soient positives. Il 
s'ensuit, notamment, que le rang et la signature d’une forme sont 
égaux au nombre de variables. 

Théorème 90.2 (critère de Sylvester). Pour qu'une forme 
guadratique soit définie positive il faut et il suffit que tous les mineurs 
principaux de sa matrice soient positifs. 

Démonstration. Nécessité. Supposons qu'une 
forme quadratique à matrice À soit définie positive. Il existe alors 
une transformation non dégénérée à matrice P qui réduit la forme 
à une somme des carrés. D’après (90.3), cela signifie que 


E = P'AP 
ou 
A=(P-1) Pi. 


En appliquant la formule de Binet-Cauchy, on trouve 
A ER 1] 
( PRES ES 
LL 2:22 r k k2 ... kr 
us 1} 1 = 
2 eye pe 2 7] 
1<hki<ha< ... <hrEM 
ky ko ... dl 


= D (paf 2 er 


1£R1ÇREE « .  ChrEmM 
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Puisque la matrice P est non dégénérée, les premières r colonnes 
comptent au moins un mineur non nul. Par conséquent, pour tout r, 
le second membre de l'égalité obtenue est positif. 

Suffisance. Supposons maintenant que tous les mineurs 
principaux de la matrice À d'une certaine forme quadratique soient 


positifs. Considérons une transformation non dégénérée des variables 
à matrice 


Par hypothèse, a,;, > 0, donc la matrice donnée existe bien. Le cal- 
cul direct montre que les propriétés de la matrice B de (90.3) sont 
les suivantes. Premièrement, les éléments non diagonaux de sa premiè- 
re colonne et de sa première ligne sont nuls; deuxièmement, tous 
ses mineurs principaux coincident avec les mineurs principaux de la 
matrice À. 

Ainsi, en réalisant la transformation, on dégage dans la forme 
quadratique initiale le carré de l’une des variables et une forme qua- 
dratique des autres nm — 1 variables. En vertu de l'égalité 


IL 2 Sr Do aiT 

4, 2 … r]=aue (s er L 
pour tout r > 2, les mineurs principaux de la matrice de la forme 
quadratique obtenue des m — 1 variables sont positifs. A présent, 
réduisons cette forme quadratique à une forme des m— 2 variables, 
etc., jusqu’à ce que toute la forme initiale ne soit réduite à une 
forme canonique. Tous les termes de la forme canonique sont positifs, 
donc la forme quadratique initiale est définie positive. Le théorè- 
me est démontré. 

Dans certains problèmes, il est nécessaire de ramener la.forme 
canonique par la même transformation linéaire des variables non pas 
une mais deux formes quadratiques simultanément. On peut 
bien le faire si l’une des formes est définie positive. En effet, 
soient (Az, x) et (Czx, x) deux formes quadratiques, la première 
étant définie positive. Réduisons d’abord par une transformation 
non dégénérée (90.2) la forme (Az, x) à sa forme normale (y, y). 
La deuxième forme sera alors réduite à une certaine forme (Dy, y). 
Ensuite, par une transformation orthogonale, ramenons la forme 
(Dy, y) à sa forme canonique. La forme (y, y) reste évidemment 
normale. 


20—01090 
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Parfois il s'avère nécessaire d'étudier ce qu’on appelle formes 
définies négatives. Une forme quadratique (Az, zx) est dite définie 
négative si (Az, x) << O0 pour tout zx 0. Il est clair qu’une forme 
quadratique à matrice À est définie négative si et seulement si la 
forme à matrice (—À) est définie positive. 


Exercices 


1. Montrer que la trace de la matrice d’une forme quadratique ne change 
pas à la suite d’une transformation orthogonale des variables. 

2. Prouver que deux formes quadratiques aux matrices dont les détermi- 
nants sont de signes opposés ne sont pas affinement équivalentes. 

3. Montrer que pour qu'une forme quadratique soit définie négative il 
faut et il suffit que les mineurs principaux de sa matrice possèdent des signes 
alternés et que, de plus, ay, < 0. 

4. Prouver que si tous Tes mineurs principaux de la matrice d'une forme 
quadratique sont négatifs, l’indice d'inertie négatif de la forme vaut l'unité. 

5. Supposons que les mineurs principaux de la matrice d’une forme qua- 
dratique aient des que alternés et que, de plus, a;, > 0. Montrer que l'indice 
d'inertie positif de la forme est égal à l'unité. 


$S 91. Hyperquadriques 


L'étude des formes quadratiques est intimement liée à celle d’au- 
tres objets que sont les hyperquadriques. Pour insister sur le caractère 
géométrique de nombreuses propriétés des hyperquadriques, presque 
partout dans ce qui suit les vecteurs de l’espace euclidien R,, seront 
appelés points. | 

On appelle hkyperquadrique f de l'espace R,, le lieu géométrique 


des points dont les coordonnées x;, z:, . . ., Zn Vérifient l'équation 
m mMm m 
> > GT; — 2 ÿ btr +c=0, (91.1) 
i=1 J=1 Rk=1 


Où &ij, db», c sont des nombres réels. 

Simplifions cette fois encore l'écriture. De même que dans le cas 
des formes quadratiques, supposons que la matrice À à coefficients 
a;, soit symétrique. Désignons par b le vecteur de coordonnées b;, 
b:, . .., bm. Maintenant, une hyperquadrique f de l’espace R,, 
peut être considérée comme lieu géométrique des points x de RÀ,, 
qui satisfont à l’équation 


(Az, z) — 2(b,z) + c = 0. (91.2) 


Nous commençons l’étude des hyperquadriques par celle de la posi- 
tion relative de ces surfaces et des droites. Considérons dans R, 
une droite arbitraire. Supposons qu'elle passe par un point zx, et 
possède un vecteur directeur /. Les points x de cette droite sont défi- 


nis par l'égalité 
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pour tous les nombres réels ft. Portons cette expression de z dans 
(91.2) pour obtenir 


(AI, D) — 2t ((b, ?) — (AË, xo)) + (Atos To) — 2 (6, 2x0) + € = 0. 

(94.4) 
Ainsi, les points d’intersection de la droite (91.3) et de l'hyperquadri- 
que (91.2) sont définis par les racines de l’équation du second degré 
(91.4). 

Si (A1, D) 0 ((AÏ, D = 0), nous dirons que la direction de la 
droite (91.3) à vecteur directeur Z est non asymptotique (asymptotique) 
par rapport à l'hyperquadrique (91.2). 

Considérons toutes les droites d’une direction non asymptotique £ 
qui coupent l’'hyperquadrique. Les points d’intersection déterminent 
sur chacune de ces droites un segment que nous appellerons corde 
par analogie avec la géométrie élémentaire. Notons L l’ensemble des 

milieux de toutes les cordes. Si les extrémitésj d'une corde ten- 
dent vers un point, nous admettrons que ce point est précisément 
le milieu de la corde. Montrons que L appartient à un certain hyper- 
plan. 

Les extrémités de toute corde sont déterminées par les valeurs 
du paramètre £{ qui coïincident avec les racines de l'équation (91.4). 
C'est pourquoi le milieu d'une corde est déterminé par la valeur de £ 


égale à la demi-somme des racines correspondantes. D’après les 
formules de Viète, cela donne 


ren (91.5) 


Si z, est le milieu d’une corde, il vient 


b, 1) — (Al, 
Z= To + ( TT Zo) L. 


A présent, on a 


b, 1) — (AI, 
(A, 2) = (A1, 20+ EE 1) = 


= (A, 20) + LEE) (AI, 1) = (b, 1). 
Ainsi, les milieux de toutes les cordes satisfont à l'équation 


(AI, x) = (b, D. (94.6) 


Puisque son second membre ne dépend pas de x,, d’après (46.8) cette 
équation définit un hyperplan dont le vecteur normal est”Al. 
L'hyperplan (91.6) s ‘appelle kyperplan diamétral conjugué à la 
direction L par rapport à l’hyperquadrique (91.2). 
La forme explicite de l'équation de l’hyperplan diamétral permet 
de déduire plusieurs propriétés importantes des hyperquadriques. 


20% 
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Soit À une matrice non ne Alors, pour tous les vecteurs 
linéairement indépendants L, l,, ..., 1 les vecteurs Al, Al, ... 

, Alm sont aussi linéairement indépendants. Supposons ensuite 
que toutes les directions L;, L,, ..., ln soient non asymptotiques. Il 
en est ainsi, par exemple, dans le cas 4’ une matrice À définie posi- 
tive. Par conséquent, on peut construire un système de m hyper- 
plans diamétraux conjugués aux directions L,, L+, ..., L,. Les hyper- 
plans ont un point commun unique z*. Maintenant la formule (91.6) 
entraîne les égalités 


(Az* — b, L) = 0 


pour à = 4, 2, ..., m. Vu la dépendance linéaire des vecteurs l, 
cela traduit le fait que Az* — b = 0, c'est-à-dire que le point r* 
n’est rien d'autre qu’une solution du système d'équations linéaires 
algébriques 

Az = b. (91.7) 


La solution d’un système à matrice non dégénérée est unique; c'est 
pourquoi en Fe le point construit x* ne dépend pas du choix des 
vecteurs L,, DL, ..., ln. 

Des calculs bien simples montrent que tout point z* vérifie la 
relation 


(az, z) — 2 (b, z)+c— 
= (4(x—zx*), (x — x*)) + 2 (Ar* — b, x — 1°) + (Az*, 1°) — 
—2 (b, 2) +ec. 


Mais si z* est une solution du système (91.7), par rapport à un tel 
point, l'hypersurface (91.2) est munie de la propriété importante de 
symétrie. Plus précisément, pour tout x, le premier membre de 
(91.2) prend les mêmes valeurs aux points 


z = 2" + (zx — x*), 
z' = 2" — (x — 1*). 


! Ilen résulte en particulier que les deux points x et x’ appartien- 
nent ou n "appartiennent pas simultanément à l'hyperquadrique 
(91.2). L'égalité 


z=+(z+7) 


permet de nommer le point x* centre de symétrie de l'hyperquadrique. 
Si l'hyperquadrique (91.2) comporte au moins un point de Ra; le 
centre de symétrie est dit réel. Dans le cas contraire on dit qu'il est 
imaginaire. 

Supposons maintenant qu'un point. z* soit centre de symétrie, 
c'est-à-dire, pour tout x, le premier membre de (912) prend les 
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mêmes valeurs aux points x et x’. Ceci n’est possible que dans le cas 
où ÀAz* — b = 0, c'est-à-dire si le point x* est une solution du 
système. 

Constatons que nous n'avons supposé nulle part que la matrice À 
soit non dégénérée ou définie positive. C’est pourquoi 

Pour qu'un système Az = b ait une solution, il faut et il suffit 
que l'hyperquadrique (91.2) possède un centre de symétrie. L'ensemble 
de toutes Les solutions se confond avec l'ensemble des centres de symétrie. 

Ainsi on découvre une liaison intime entre les systèmes d’équa- 
tions linéaires algébriques et les hyperquadriques. Cette liaison est 
largement mise en valeur pour construire des algorithmes de calcul 
numérique les plus divers. En particulier, la construction d'un systè- 
me d'hyperplans diamétraux est à la base d’un grand groupe de 
méthodes dites méthodes des directions conjuguées. L'étude de ces 
questions dépasse le cadre de notre exposé. 

Dans le cas général, l'étude d'une hyperquadrique peut être 
basée sur sa réduction à la forme canonique à l’aide des transforma- 
tions linéaires non dégénérées des variables et des translations. 

Examinons n'importe quelle transformation des variables (90.2) 
qui réduit la forme quadratique (Az, x) à la forme normale. Avec 
les variables y, Ye, . . ., Ym, l'équation de l’hyperquadrique se met 
sous la forme 


te 
— diys — .. . — DdyYyr — QdryaYrss — + + — 2mYm +c=0. 
Réalisons maintenant une translation d'après les formules 
Yi — di, 1<i<k, 


Zi = Yi+ di k+1<i<r, 
Yi r+1<i<m. 


Avec ces dernières variables, l'équation s'écrit 
2H... Hz — — 22 — 2dr442r4s — - + + — 2dm2m + P = 0. 


Supposons que parmi les nombres d,41, . . ., dm, il y ait un non nul, 
par exemple, d,, 0. Posons 
AE LL M, 
Lu dr442r#t Fo. + dm2m, =, 
et réalisons encore une translation 


Uis im, 
Uy = | 
: DS) = M. 
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Maintenant l'équation de l’'hyperquadrique devient 
Hu t+tut...Lu—-2un=0, 1<r<m—1. (91.8) 
Si parmi les nombres d,4,,..., dm, Piln'y a aucun nombre non 
nul, l'équation de l'hyperquadrique s'écrit 
Hu +tu +... ELu=0, 1<r<m. (91.9) 
Et, enfin, si les nombres d,4,, ...,dn sont nuls, alors que p 0, 


en posant pour tout à 
2 


U; = 


Vil” 
on obtient encore une forme de l'équation de l'hyperquadrique: 
Eu tu +... +HuwT+1=0, 1<r<m. (91.10) 


La loi d'inertie des formes quadratiques fait que les surfaces 
données par des équations différentes de la forme (91.8) à (91.10) ne 
peuvent pas être réduites l’une à l’autre à l’aide d'une transfor- 
mation linéaire des variables et d’une translation. Dans ces condi- 
tions il'faut envisager comme différentes les équations qui ne peuvent 
pas être transformées l’une en l’autre en les multipliant par (—1) 
et en changeant la numérotation des coordonnées. De même que 
dansŸle cas des formes quadratiques, nous avons obtenu encore la 
partition de toutes les hyperquadriques en classes disjointes. 

Il arrive souvent que pour réduire les hyperquadriques à leur 
forme canonique on n'utilise que les translations et les transforma- 
tions linéaires des variables à matrices orthogonales. Il en est ainsi 
surtout parce que ces deux types de transformations ne changent pas 
la distance entre les points. Dans ce cas, les formes canoniques diffè- 
rent quelque peu bien que dans l'essentiel elles s’obtiennent de la 
même façon que les formes examinées ci-dessus. Par exemple, dans 
le cas de l’espace R., une hyperquadrique ne se réduit qu’à une 
des formes suivantes: 


I. Az+hy?+a = 0, 
II. Ay2+ br = 0, | 
IIT. Az? + a = 0, 
et dans le cas de l’espace R,, à l’une des formes 
I A++ A+ a,—0, 
IT. Az? + og? + boz = 0, 
III. Az +y+a = 0, (91.12) 
IV. Ag +bor = 0, 
V. Az ta =0. 


(91.11) 
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Dans toutes les équations (91.11), (91.12), les coefficients des 
variables sont différents de zéro. Le terme constant peut être nul. 
Dans le langage traditionnel, les hyperquadriques de l’espace À, 
seront appelées courbes du second degré ou coniques et celles de l’espace 
R, surfaces du second degré ou quadriques. Pour faire face aux exigen- 
ces imposées par de nombreuses branches des mathématiques, nous 
passons à une étude plus poussée des coniques et des quadriques 
à partir de leurs formes canoniques (91.11), (91.12). 


Exercices 


1. Soit À une matrice définie positive. Montrer que l'expression (Az, z) — 
— 2 (b,zx) est minimisée sur la solution du système Az = b. 

2. Soit À une matrice définie positive. Prouver que sur la droite (91.3) 
l'expression (4x, x) — 2 (b, x) est minimisée pour la valeur de t fournie par (91.5). 

3. Montrer que pour que toute direction soit non asymptotique pour une 
hyperquadrique (91.2), il faut et il suffit que la forme quadratique (A7, x) 
soit ou bien définie positive, ou bien définie négative. 

&. Quelle propriété de symétrie possède un hyperplan diamétral conjugué 
à la direction !, si L est un vecteur propre de la matrice À associé à une valeur 
propre non nulle? 

5. Montrer que le système Az — b ne possède pas de solution si et seule- 
ment si l’hyperquadrique (91.2) se réduit à la forme canonique (91.8). 


$ 92. Coniques 


Nous étudierons les coniques d’après les équations (91.11). Soit 
l'équation de la forme 


Az? + A? + ao = 0. (92.1) 


I.1. Le nombre a, n'est pas nul; les nombres À, À, de signes iden- 
tiques ont tous le même signe opposé à celui de a,. Mettons (92.1) sous 
la forme 


et notons 


_. ao _3/. % 
ay —#, b=y -. (92.2) 


Par hypothèse, les nombres a et b sont réels ; (92.1) est donc équi- 
valente à l'équation 


2 2 
tp. (92.3) 


La courbe décrite par cette équation est une ellipse (fig. 92.1), alors 
que l'équation elle-même s'appelle équation canonique d'une ellipse. 
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Voici quelques-unes des propriétés de l’ellipse. Une ellipse est une 
courbe bornée. I] résulte de l'équation (92.3) que pour tous ses points 
Izl< a |y|<b. Une ellipse possède deux axes de symétrie 


Fig. 92.2. 


Ox et Oy, ainsi qu'un centre de symétrie qui est à l'origine des 
coordonnées. On le déduit du fait qu'avec chaque point de coor- 
données (x, y) l’ellipse contient aussi les points de coordonnées 
(x, —y), (—z, y), (—z, —y). Les axes de symétrie s’appellent axes 
principaux, le centre de symétrie centre de l’ellipse. Si a > b, Oz 
est dit grand axe et Oy petit axe. Les points d'intersection des 
axes principaux avec l’ellipse se nomment sommets. Pour a = b, une 
ellipse devient circonférence de centre en l’origine des coordonnées 
et de rayon a. Supposons, pour fixer les idées, que a > b et dési- 
gnons 


c? = a? — b?, (92.4) 


Les points F,, F, de coordonnées (—c, 0), (+c, 0) sont appelés 
foyers. 
Théorème 92.1. La somme des distances d'un point quelconque 
d'une ellipse à ses foyers est une constante égale à 2a. 
Démonstration. Pour tout point M (x, y) de l’ellipse 


y= D — 


272 


a2 


Pour ce même point, 


PO, F)= (cp += (at 9704 24 PE) 


a? 


— (2 (1-5) —9re+a) "= 


rc? 2\1/2 
= ( 72 —2xc+at) = 


= ((—£:+a))"- —<z+a. 
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La dernière égalité est vraie, puisque — +2 +a>0vuquelz|< 
<a et c/a<'1. Ensuite 


P(M,F)=((z+c)+ y)? 


=(#+2r+ere 2)" 
= (2 (1—È) +924 e) 2 (ES area) = 


=((£+))"=iste. 
On a finalement 


P(M, F;)+e0(M, F:)= —<z+a+<zt+a=)2. 


1.2. Le nombre a, n'est pas nul; les nombres À, À2, &o sont de même 
signe. Introduisons les notations 


a=— Te b= Fe: (92.5) 
alors, (92.1) est équivalente à l'équation 
2 2 
+= +. (92.6) 


Il est clair qu'aucun point du plan ne satisfait à (92.6). Il est 
d'usage de dire que (92.6) est l'équation d'une ellipse imaginaire. 
I.3. Le nombre a, est nul; les nombres À, À. sont de même signe. 


Notons 
1 Â 
=V +, = : 
é E" E* 


% 


alors (92.1) est équivalente à l’équation 
22 2 
T+i=0. (92.7} 


Il est clair qu'il n’y a que l’origine des coordonnées qui satisfait 
à (92.7). Il est d'usage de dire que (92.7) est l'équation d’une ellipse 
dégénérée. 

1.4. Le nombre a, n'est pas nul; les nombres À,, À, sont de signes 
opposés. En introduisant de nouveaux coefficients analogues à (92.2), 
(92.5), ramenons (92.1) à l'équation équivalente (à changement de 
la notation des variables près): 


EE 1. (92.8) 
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La courbe décrite par cette équation est une hyperbole (fig. 92.2), 
alors que l'équation elle-même s'appelle équation canonique d'une 


Fig. 92.2. 


hyperbole. À la différence 
d'une ellipse, une hyperbole 
est une courbe non bornée. 
De même qu'une ellipse, une 
hyperbole possède deux axes 
de symétrie qui sont les axes 
de coordonnées et un centre 
de symétrie à l’origine des 
coordonnées. Les axes de sy- 
métrie sont appelés axes prin- 
cipaux, le centre de symétrie 
centre de l’hyperbole. L'un 
des axes principaux (Oz) 
coupe l'hyperbole en deux 


points appelés sommets. Cet axe s’appelle l’axe réel de l’'hyper- 
bole. L'autre axe (Oy) ne possède pas de points communs avec la 
courbe et pour cette raison on dit qu’il est imaginaire. Notons 


c = a° + b?. 


Les points F,, F, de coordonnées (—c, 0) (+c, 0) sont appelés foyers. 
Théorème 92.2. La valeur absolue de la différence des distances 
de tout point d’une hyperbole à ses foyers est une constante égale à 2a. 
Démonstration. Pour tout point M (x, y) d'une hyper- 


bole 


De 


= —b+ 


Pour ce même point, on calcule 
= (2 Qxc + c2—b2+ 272 = 


= (2 (4 +8) 2u40t) Fe (92e +) = 


Ensuite, 


£ (M, Fi) = ((z+ cc) + y2)1/2— 


=(#+2+e+S2-n)"- 


=(2(1+5)+2%+æ)"- 


= 


tree) ((Le+e)) "= 
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Pour tous les points de l’hyperbole, on a |z | >aet c/a > 1. Donc 


za pour z>0, 


P(M, rs | 


* 


—<z+a pour z<O0, 


z+a pour z>0, 


p (M, ro | c 
——T—a pour z<0(. 


Finalement, 
le (M, F1) —p (M, F2) | = 2a. 


Considérons la partie de l’hyperbole qui appartient au premier 
quadrant. Pour cette partie, z > a, y > 0. Dans ce quadrant (92.8) 
est équivalente à l'équation 


y= Vrai, 


si, évidemment, on admet que b > 0, a > 0. On voit aisément que 
cette fonction peut être mise sous la forme 


b ba 
Examinons, avec la fonction (92.9), l'équation de la droite 
= z. (92.10) 


Désignons par M (x, y) et M” (x, y') les points de l’hyperbole (92.9) 
et de la droite (92.10) de même abscisse zx. Lorsque zx croît indé- 
finiment, la difference 
RENTE ba 
y y = z+V 220 0 

tout en restant positive, décroît monotonement et tend vers zéro. 
Par conséquent, les points M et M” se rapprochent, mais le point M 
de l'hyperbole reste toujours au-dessous du point M” de la droite 
(92.10). 

Une propriété analogue a lieu également pour les autres parties 
de l'hyperbole. La droite (92.10) est représentée ici par l'une des 
droites 


y=T a, y = — 25. (92.11) 


Ces dernières s'appellent asymptotes de l'hyperbole. 
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Constatons que nous avons nommé (92.8) équation d’une hyper- 
bole. Or, dans la géométrie élémentaire on peut trouver une tout 
autre équation dite aussi de l’hyperbole. 

Changeons les coordonnées suivant (92.11) 


Alors (92.8) entraîne 


z z 
(5-2) (2+4)=1 
Par conséquent, dans le nouveau système de coordonnées (en géné- 
ral, non rectangulaire), l'équation d’une hyperbole se met sous la 
forme 

Ty —=1 (92.12) 
ou 

, 1 


for 


z 


Ceci est précisément l'équation mentionnée de la géométrie élé- 
mentaire. On dit que (92.12) est l'équation d’une hyperbole par 
rapport à ses asymptotes. 

I.5. Le nombre a, est nul, |les nombres À, À, sont de signes opposés. 
Après une substitution des coefficients analogue aux cas précédents, 
on obtient l'équation 

ep (92.13) 


a2  b? 
équivalente à (92.1). De cette dernière, on tire 


Z y zZ  Yÿ\ 

(£-+)(5+4)=0 
ou 

y=z, y=—2z. (92.14) 

Ainsi, (92.13) est l'équation d’une courbe qui se décompose en 


deux droites concourantes (92.14). 
Considérons à présent la deuxième équation de (91.11). On a 


Ay° + bot = 0. (92.15) 
_ 11.6. Les deux nombres À., b, sont différents de zéro. Désignons 


2p=—# #0. 
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Maintenant (92.15) est équivalente à l’équation 
= 2pz. (92.16) 


La courbe décrite par cette équation est une parabole (fig. 92.3), 
alors que l'équation elle-même est l'équation canonique d'une para- 
bole. On peut admettre sans restreindre la généralité que p > 0, 
puisque pour p << 0 on obtient une courbe symétrique à la précédente 
par rapport à Oy. De même qu’une hy- 
perbole, une parabole est une courbe non 
bornée qui n’a qu’un axe de symétrie 
(Oz) et n’a pas de centre de symétrie. Le 
point d’intersection de l’axe d’une para- 
bole avec la parabole elle-même est dit 


sommet. Le point F de coordonnées (5, 0) 


s'appelle foyer. La droite L donnée par 
l'équation 


P 
T=—5 (92.17) Fig. 92.3. 


est la directrice de la parabole. 
Théorème 92.3. La distance d'un point quelconque d'une 
parabole à sa directrice est égale à La distance de ce même point au foyer. 
Démonstration. On a pour tout point M (x, y) 
P(L, M}=r++, 


et ensuite 
or ((e—2) +) ((e-2) 427) 
= (2 pr+%+92pz) "= (rt pr+ EVE 


= ((+9)) ee. 
puisque z > Oetp > 0. 


Enfin, examinons la troisième équation de (91.11). Elle est 
d'une forme très simple 


Mz° + ao = 0. (92.18) 


IL. 7. Le nombre a, n'est pas nul; le signe du nombre À, est opposé 
à celui de as. Notons 


_ __%. 

a? — %e ? 
l'équation de la courbe (92.18) est alors équivalente à l'équation 
x — a =0 (92.19) 
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ou 
T=4 TI= — a. (92.20) 


Par conséquent, (92.19) est l’équation d'une courbe qui se décompose 
en deux droites parallèles (92.20). 

III.8. Le nombre a, n'est pas nul; le signe du nombre À, coïncide 
avec le signe de a,;. Introduisons la notation 


2— 4% ne 
a M , 


(92.18) est alors équivalente à l'équation 
23 + a = 0. (92.21) 


Il est clair que cette équation n’est vérifiée par aucun point du 


plan. Il est d'usage de dire que (92.21) est l’équation délinissant 
deux droites imaginaires. 


II1.9. Le nombre a, est nul. Dans ce cas (92.18) est équivalente 
à l'équation 


= 0. (92.22) 


Par analogie avec (92.19), il est d’usage de dire que (92.22) définit 
deux droites confondues dont chacune est donnée par l’équation 


z = (. 


Constatons que chaque point d’une ellipse ou d’une hyperbole 
donne lieu aux égalités suivantes: 
| (92.23) 


Les droites &; (à = 1, 2) définies par les équations 


2 
PM, F)=<|r-< 


C 


2 
P(M, F)=+|r+< 


20, z+#=0, (92.24) 


s'appellent directrices d’une ellipse et d’une hyperbole. Si une direc- 
trice et un foyer appartiennent au même demi-plan défini par l’axe 
Oy, affectons-les de même indice. Alors, on peut montrer que 

Le rapport des distances p (M, F;) et p (M, &:) est une constan- 
le pour tous les points M d’une ellipse, d'une hyperbole et d'une pa- 
rabole. 

Pour une parabole, cette proposition se déduit du théorème 92.3, 
pour une ellipse et une hyperbole, des formules (92.23), (92.24). 
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La valeur 
e=-2 (M, Pi) 
p(M, @i) 
est appelée excentricité. On a 
ne er — b2 \1/2 
pour une ellipse: e=—= (1——) 1, 
2 
pour une hyperbole: e=—— (+4) >1, 


a 
pour une parabole: e = 1. 


Exercices 


1. L'hyperplan diamétral conjugué à une direction donnée que représente- 
t-il pour les courbes du second degré? 


_ 2. Ecrire l'équation d'une tangente à l'ellipse, à l'hyperbole et à la para- 
ole. 


3. Montrer qu'un rayon de lumière issu de l’un des foyers d'une ellipse, 
après réflexion par la tangente, passe par le deuxième foyer. 

4. Montrer qu’un rayon de lumière issu du foyer d'une parabole, après 
réflexion par la tangente, passe parallèlement à l’axe de la parabole. 

5. Montrer qu’un rayon de lumière issu de l’un des foyers d’une hyperbole, 
après réflexion par la tangente, semble s'échapper du deuxième foyer. 


$ 93. Quadriques 


Passons maintenant à l’étude des quadriques données sous la 
forme des équations (91.12). Examinons d’abord l'équation 


Mz° + Ag? + As 2 + ao = 0. (93.1) 


I.1. Le nombre a, n'est pas nul; les signes de tous les nombres 
Mr À À sont identiques et opposés au signe de as. La substitution 
usuelle des coefficients donne 


2 2 2 
+ +Ss=t. (93.2) 


La surface décrite par cette équation est un ellipsoïde (fig. 93.1) 
et l'équation elle-même s'appelle équation canonique d’un ellipsoï- 
de. L’équation (93.2) entraîne que les plans des coordonnées sont des 
plans de symétrie, l’origine des coordonnées étant un centre de symé- 
trie. Les nombres a, b, c s'appellent demi-axes. Un ellipsoide est une 
surface bornée par le parallélépipède |z|<a, Iyl<b,1z1<c. 
La ligne d’intersection d'un ellipsoïde avec un plan est une ellipse. 
En effet, une telle ligne d'’intersection est une courbe du second 
degré. Un ellipsoïde étant borné, cette courbe l’est aussi, mais parmi 
les coniques l’ellipse est l'unique courbe bornée. 
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1.2. Le nombre a, n'est pas nul; les signes de tous les nombres k,, 
À, À4 sont identiques. Une substitution usuelle des coefficients donne 
z2 


2 2 
++ s=-1 (93.3) 


Les coordonnées d'aucun point de l’espace ne vérifient cette équa- 
tion. Il est d'usage de dire que (93.3) est l'équation d’un ellipsoïde 
imaginaire. 


Fig. 93.1. Fig. 93.2. 


1.3. Le nombre a, est nul; tous les nombres À,, 2.., }., sont de signes 
identiques. Il vient 


++ += 0. (92.4) 


Cette équation n’est vérifiée que par l’origine des coordonnées. Il 
est d'usage de dire que (93.4) est l'équation d’un ellipsoïde dégénéré. 
1.4. Le nombre a, n'est pas nul; les signes de À,, À, sont identiques 


et opposés au signe de À, a. Une substitution usuelle des coefficients 
donne 


z2 y 2? 


+ Et. (93.5) 


La surface décrite par cette équation est un hkyperboloïde à une 
nappe (fig. 93.2), l'équation elle-même s’appelant équation canoni- 
que d’un hyperboloïde à «une nappe. L’équation (93.5) entraîne que 
les plans des coordonnées sont les plans de symétrie et l’origine des 
coordonnées le centre ‘de symétrie. Considérons les courbes L, de 
l’intersection d’un hyperboloïde à une nappe avec les plans z = h. 
L'équation de la projection d’une telle courbe sur le plan Ozy est 
fournie par l'équation (93.5) si l’on y pose z = hk. On voit aisément 
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que cette courbe est une ellipse 


22 y2 
ae toi 


a* = aV1 + h%/c?, b* — bV 1 + h’/ci, 


ses dimensions tendant vers l'infini pour À —> + oo. La section d’un 
hyperboloïde à une nappe par des plans Oyz et Ozxz sont des hyper- 
boles. 

Ainsi, un hyperboloïde à une nappe est analogue à un tube évasé 
indéfiniment dans le sens positif et négatif de l'axe Oz. 

L.5. Le nombre a, n'est pas nul; les signes de 14, À, ao coincident 


et sont opposés à celui Fe À. une façon analogue à (93.5), on a 
22 


— Re b2 = — À, (93.6) 


La surface décrite par cette équation est un hyperboloïde à deux 
nappes (fig. 93.3), et l’équation elle-même est l'équation canonique 
d’un hyperboloïde à deux nappes. Les plans des coordonnées sont 
les plans de symétrie, et l'origine des coordonnées le centre de symé- 
trie. Les lignes ZL, de l'intersection de l’hyperboloïde à deux nappes 
avec les plans z — À sont des ellipses dont les équations des projec- 
tions sur le plan Ozxy sont de la forme 


y? 
a*2 + b92 =1, 


où 
a* = a —1 + htc, b* = bV —1 + het. 


Il en résulte que le plan sécant z = À coupe un hyperboloïde à à deux 
nappes seulement pour | À | > c. La couche comprise entre les plans 
—= —cet z = + c ne contient pas de points de la quadrique consi- 
dérée. La surface étant symétrique par rapport au plan Ozxy, elle se 
compose de deux nappes situées en dehors de la couche indiquée. 
Les sections d’un hyperboloïde à deux nappes par les plans Oyz 
et Oxz donnent des hyperboles. 
1.6. Le nombre a, est nul; les signes des nombres À4, À» sont iden- 
tiques et opposés au signe de À. On Le 


2 A 
++ , 6 (93.7) 


La surface définie par cette équation est un cône elliptique 
(fig. 93.4) et l'équation elle-même s’appelle équation canonique 
d’un cône elliptique. Les plans des coordonnées sont les plans de 
symétrie, l’origine des coordonnées le centre de symétrie. Les cour- 
bes L, d'intersection du cône elliptique avec les plans z = h sont des 
ellipses. Si un point M (xs, Yo, Z0) repose à la surface du cône, l’équa- 


21—01090 


C 
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tion (93.7) est vérifiée par les coordonnées du point M, (fzo, lys» 
{z,) pour tout nombre {. Par conséquent, toute droite qui passe par 


Fig. 93.3. Fig. 93.4. 


le point M, et l'origine des coordonnées appartient toute entière 
à la surface concernée. 
Passons maintenant à l’étude de la deuxième équation de (91.12). 


On a 
MT? + eg? + boz = 0. 


I1.7. Les nombres À,, À, sont de signes identiques. Sans restrein- 
dre la généralité, on peut admettre que le signe de b, est opposé du 
fait que, s’il coïncidait avec les signes de À, À, on aurait une sur- 
face symétrique par rapport au plan Oxy. La substitution usuelle des 
coefficients donne 
++. (93.8) 


2=— 
a 


La surface décrite par cette équation est un paraboloïde elliptique 
(fig. 93.5), alors que l'équation elle-même est l'équation canonique 
d’un paraboloïde elliptique. Pour cette surface, Ozxrz et Oyz sont 
des plans de symétrie, le centre de symétrie n'existe pas. Un para- 
boloïde elliptique est contenu dans le demi-espace z > 0. Les cour- 
bes L}, d'’intersection d’un paraboloïde elliptique avec les plans 
z=h, h>> 0, sont des ellipses dont les projections sur le plan Ozry 
sont définies par l'équation 


22 y2 
tie, 


$ 93] QUADRIQUES 323 


où a* = ah, b* = bV h. Il s'ensuit que lorsque À croît, les ellip- 
ses s’accroissent indéfiniment, c’est-à-dire un paraboloïde est un 
bol infini. 


La section d’un paraboloïde elliptique par les plans y — hk et 
z — h donne des paraboles. Par exemple, le plan x -: hk coupe la 
surface suivant la parabole 


contenue dans le plan x = A. 


II.8. Les nombres À, À, ont des signes différents. Dans ce cas une 
surface typique est définie par l’équation 


ne y” 
PETER be (93.9) 


La surface décrite par cette équation est un paraboloïde hyperbo- 
lique (fig. 93.6), alors que l’équation elle-même est l’équation cano- 


Z 


Fig. 93.5. Fig. 93.6. 


nique d’un paraboloïde hyperbolique. Les plans Oxz'et Oyz sont des 
plans de symétrie, le centre de symétrie n’existe pas. Les courbes 
d’intersection d’un paraboloïde hyperbolique avec les plans z —h 
sont pour k > 0 les hyperboles 


où a* = ah, b* — bV het, pour k < 0, les hyperboles 


#2 y? 
ie tie il, 
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où a* = a —h, b* = bV —kh. Le plan z = 0 coupe le paraboloïde 
hyperbolique suivant deux droites 


b 
y = rt 


Toutes les surfaces définies par les équations III à V de (91.12) ne 
dépendent pas de z. C’est pourquoi les projections sur le plan Ozy 
des courbes d'intersection de ces surfaces avec les plans z = h ne 
dépendent pas non plus de h. Ces surfaces sont dites cylindres et, 
pour les définir mieux, on ajoute elliptique, hyperbolique, etc., 
suivant la forme de la projection de la surface sur le plan Ozxy. 

Théorème 93.1. Par chaque point d'un hyperboloïde à une 
nappe ou d'un parbaoloïde hyperbolique passent deux droites distinc- 
tes contenues complètement dans la surface concernée. 

Démonstration. Considérons un hyperboloïde à une 
nappe donné par son équation canonique 


UE EE) (93.10) 
Quels que soient a, B non simultanément nuls, le couple des plans 


nu) + Fe) = LA 
a(i+e)=8(1-4), 8(-S)=e(t+é) 6341 

définit une certaine droite l'. On vérifie sans peine que la droite T 
donnée est contenue complètement dans la surface (93.10). Par 
surcroît, par chaque point de cette surface passe une droite de la 
famille des droites T. 

En effet, considérons (93.11) comme un système de deux équa- 
tions | 

z 2 y\ 
ni ac à ul Cine + | 
y 2e, EN 
oi Ch à oi Curs el. 

par rapport à a, f. Le déterminant de ce système est nul si et seule- 
ment si le point M (zx, y, z) appartient à l’hyperboloïde (93.10). 
En outre, le rang de la matrice du système est alors égal à l'unité. 
Par conséquent, a et B sont définis à la proportionnalité près. Or, 
cela traduit l’unicité de la droite [qui passe par chaque point de 
l'hyperboloïde. 

D'une façon analogue on montre que par chaque point d’un hyper- 
boloïde passe une droite unique l'* définie par les plans 


AEHE) = (148) a(8—2) (9) 


a 


$ 93. QUADRIQUES 325 


Les droites l et l'* sont distinctes. Des raisonnements analogues 
montrent que le paraboloïde hyperbolique 


est formé par deux familles distinctes de droites II et I1* définies 
par les plans 


et 


e 
NS 
l 
> 
PR, 
CS ES 
| 
œ|e 
__—”"”" 
> 
] 
€ 
nn, 
an 
+ 
œl< 
Rd 


Exercices 


1. L’hyperplan diamétral conjugué à une direction donnée que représente- 
t-il pour les quadriques? 

2. Ecrire l'équation d'un plan tangent pour les quadriques différentes. 

3. Etudier les proprietés optiques des quadriques. 
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